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CALCUL  DLS  PROl]  VIRILITÉS 


PUEMIÈRE  LEÇON 


1.  L'on  ne  peut  guère  donner  une  délinition  satisfaisante 
de  la  Prohabililé.  On  dit  ordinairement  :  La  probabilité  d'un 
événement  est  le  rapport  du  nombre  des  cas  favorables  à  cet 
événement  au  nombre  total  des  cas  possibles. 

Ainsi,  si  le  premier  nom!)re  est  n  et  le  second  N,  la  probabi- 

lilé  est  -,  ■.  cette    définition,  dans  certains   cas,    ne  soulève 

aucune  dilViculté.  —  Dans  un  jeu  de  ^2  cartes,  la  probabilité  de 

4 

tirer  un  roi  est  .— >  puisque  le  nombre  total  des  cas  possibles, 

c'est-à-dire  des  cartes,  est  32,  et  que  parmi  ces  caries  il  y  a 
quatre  rois;  on  a  donc  ici  X  =^  32,  n  =4.  —  Quand  on  jette 

1 

un  dé,  la  probabilité  d'amener  le  point   4  est  -t  car  \  .-=  6 

et  /i  =  i,  le  dé  ayant  6  faces  dont  une  seule  porte  le  pointa. 

—  Dans  une  urne  qui  contient  n  boules  blanclies  et  p  boules 

noires,  on  tire  une  boule;  la  probabilité  (pi'elle  soit  blanche 

n 
est ' 

2.  Prenons  un  exemple  un  peu  plus  compliqui'.  —  Deux 
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urnes,  qui  ne  diffèrent  pas  extérieurement,  renferment  la 
première  n  boules  blanches  etp  noires,  la  seconde  w' blanches 
et  p'  noires. 

On  fait  tirer  une  boule  à  une  personne,  et  on  demande 
quelle  est  la  probabilité  pour  amener  blanche.  On  pourrait 
dire  que  le  nombre  total  des  cas  est  n  -{■  n'  -\-  p  -[-  p'  et  que 

la  probabilité  est  — ■. — ^, , ;•  On  peut  dire  aussi  que 

'  n  -\-  n   -\-  p  -{-  p  ^ 

deux  cas  peuvent  d'abord  se  présenter,  soit  la  première,  soit 
la  seconde  urne  ;  le  probabilité  de  prendre  dans  la  première 

1  1 

est  -■>  et  dans  la  seconde  -'  car  il  y  a  autant  de  chances  de 

mettre  la  main  dans  l'une  que  dans  l'autre.  Si  j'ai  mis  la 

main  dans  la  première  urne,  la  probabilité  est  • — p —  pour 

que,  prenant  dans  la  première  urne,  on  ait  une  boule  blanche  ; 
en  vertu  du  théorème  de  la  probabilité  composée,  que  je  ne 
tarderai  pas  à  établir,  la  probabilité  de  mettre  à  la  fois  la 
main  dans  la  première  urne  et  d'en  tirer  une  boule  blanche 

1  n 

est- — ; — ;  la  probabilité  analosfue  pour  la  seconde  urne 

2  n  +  //        ^  o       t 

,  1       n' 
6St  ^  -,-  , — ,' 
2  w  -f-  p 


La  somme 


1       n' 


2  w  -|-  p       2  n'  -)-  p' 


est  l'évaluation  correcte  de  la  probabilité  demandée,  et  il  n'y 
aura  égalité  entre  les  deux  évaluations  que  dans  un  cas  par- 
ticulier : 


,        ,     T  n       n 

c  est-a-dire      -  = 


n  -\-  p        n  -\-  p'  p       p 
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A  quoi  tient  cette  diveryenee?  A  ce  que  les  n  -f-  n  -^p  -\-p' 
cas  ne  sont  pas  également  probables. 

Ainsi,  supposons  qu'il  y  ait  deux  fois  plus  de  boules  dans 
la  première  urne 

n  A-p  =  ^[n-\-  p). 

La  probabilité  pour  que  je  prenne  une  boule  donnée  dans 

1 

cette  urne  est  r-; — ; -;  et  pour  que  je  la  prenne  dans  la 

2  (n  -j-  p)         ^  ^      "*  ' 

1 

seconde  elle  est 


n-\-  p) 
A  la  définilion  de  la  probabilité,  il  faut  donc  ajouter  :  à 

condition  que  tous  les  cas  soient  également  vraisemblables. 

Citons  deux  autres  exemples  dus  à  M.  Bertrand. 

3.  Problème  des  trois  coffrets.  —  Trois  coffrets  iden- 
tiques, A,B,C,  ont  chacun  deux  tiroirs,  x,  8;  ceux  de  A  con- 
tiennent chacun  une  pièce  d'or,  ceux  de  B  une  pièce  d'ar- 
gent, et  ceux  de  C  ont  l'un  une  pièce  d'or,  l'autre  une  pièce 
d'argent  : 

ABC 

a  or  argent  or 

&  or  argent  argent. 

Quelle  est  la  probabilité  pour  que,  en  ouvrant  au  hasard 
un  des  six  tiroirs,  l'on  ait  une  pièce  d'or?  Six  cas  sont  éga- 
lement probables  :  Ax,  Ap,  Ba,  Bp,  Ca  et  C,8;  de  ces  six  cas, 

trois  sont  favorables  à  l'arrivée  de  la  pièce  d'or  :  Aa,  Afi,  Ca. 

1 

La  probabilité  est  donc  -• 

Si  l'on  prend  un  des  trois  coffrets  au  hasard,  la  probabi- 
lité pour  prendre  C  est  -• 


CALCUL    DES    PROBABILITES 


J'ouvre  au  hasard  un  des  tiroirs,  j'y  trouve  une  médaille 
d'or;  quelle  est  la  probabilité  pour  que  la  deuxième  médaille 
soit  en  argent? 

Ou  bien,  je  suis  tombé  sur  le  coffret  C,  ou  bien  sur  le  cof- 
fret A  :  dans  le  premier  cas,   la  seconde  médaille  sera  en 

1 

argent,  dans  le  second  en  or.  La  probabilité  semble  donc  -• 

Cette  conclusion  est  fausse. 

Avant  d'ouvrir  le  tiroir,  je  savais  que  j'y  trouverais  une 

pièce  d'or  ou  une  pièce  d'argent  avec  une  probabilité  égale, 

1 

c'est-à-dire  -  ;   or,  je  puis  trouver  la  pièce  d'or  dans  trois 

cas,  Ax,  AS,  Ca,   et  de  ces  trois  cas  un  seul,  Ca,  est  favo- 
rable à  l'arrivée  de  la  pièce  d'argent  dans  le  second  tiroir. 

1 

Dans  la  première  évaluation  de  la  probabilité  à  -•  les  deux 

cas  envisagés  étaient  inégalement  proba!)les  :  le  cas  A  cor- 
,  respond  à  Ax  et  à  AB,  et  est  deux  fois  plus  probable  que  le 
cas  C,  qui  ne  correspond  qu'à  Ca. 

4.  Problème  du  jeu  de  boules.  —  Deux  joueurs  éga- 
lement habiles,  Pierre  et  Paul,  jouent  aux  boules;  Pierre  a 
deux  boules  à  lancer,  Paul  une  boule,  et  la  victoire  est  à 
celui  des  deux  dont  l'une  des  boules  approchera  le  plus  du 
but. 

(  Hielle  est  la  probabilité  pour  que  Paul  gagne  ? 

Soient  A  et  B  les  boules  de  Pierre,  C  celle  de  Paul  ;  six 
cas  peuvent  se  présenter,  en  rangeant  les  boules  suivant 
leur  proximité  du  but  : 

ABC.  BCA,  CAB,  ACB,  CBA,  BAC. 

Ces  six  cas  sont  également  probables  ;  ceux  (pii  donnent 
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la  victuire  à  Pierre  sont  au  iiuinlire  de  quatre,  ceux  qui 
donnent  la  victoire  à  Paul  au  nombre  de  deux  :  la  [)roljabi- 
lité  de  gagner  est  donc  r  pour  Paul. 

On  pourrait  raisonner  autrement  :  la  boule  A  de  IMerre 
est  plus  éloignée  du  but  que  C,  ou  bien  c'est  le  contraire. 

A  >  c:  ou  A  <  C. 

De  mémo  pour  la  boule  lî  : 

B  >  C  ou  H  <  C. 

Donc  quatre  cas  sont  possibles  : 

A  >  C  avec  B  >  C 

A  <  C  ..  B  >  C 

A  >  C  .)  B   ::  C 

A  <  C  .)  B  <  C. 

Un  seul  cas,  le  premier,  est  favorable  à  Paul,  puisque  sa 
boule  est  à  la  ibis  plus  rapprochée  que  A  et  B  ;  la  probabilité 

serait  donc  -• 
4 

Mais  les  quatre  cas  ne  sont  pas  également  probables. 

A  >  C  avec  B  >  C  correspond  à  2  combinaisons  CAB,  CBA 
A  <  C     »     B  >  C  »  1  ■)  ACB 

A  >  C     .)     B  <  C  »  1  »  BCA 

A  <  C     .)     B  <  C  »  2  ')  ABC,  BAC 

5.  La  définition  complète  de  la  probabilité  est  donc  une 
sorte  de  pétition  de  principe  :  comment  reconnaître  que  tous 
les  cas  sont  également  probables?  Une  définition  mathéma- 
tique iii  n'est  pas  possible  ;  nous  devrons  dans  chaque  appli- 
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cation  faire  des  coyivenlions^  dire  que  nous  considérerons  tel 
et  tel  cas  comme  également  probables.  Ces  conventions  ne 
sont  pas  tout  à  fait  arbitraires,  mais  échappent  à  l'esprit  du 
mathématicien  qui  n'aura  pas  à  les  examiner,  une  fois 
qu'elles  seront  admises. 

Ainsi  tout  problème  de  probabilité  offre  deux  périodes 
d'étude  :  la  première,  métaphysique  pour  ainsi  dire,  qui 
légitime  telle  ou  telle  convention;  la  seconde,  mathématique, 
qui  applique  à  ces  conventions  les  règles  du  calcul. 

6.  Nous  allons  grouper  les  questions  dont  nous  nous 
occuperons,  d'après  divers  points  de  vue  et  d'abord  au  point 
de  vue  du  nombre  des  cas  possibles. 

Dans  une  première  catégorie,  nous  rangerons  toutes 
celles  où  le  nombre  de  cas  possibles  est  fini,  ne  dépasse  pas 
certaines  limites  ;  en  général,  nous  aurons  affaire  à  des  jeux 
de  hasard,  à  de  simples  problèmes  d'analyse  combinatoire. 

Dans  une  deuxième  catégorie,  le  nombre  des  cas  possibles 
reste  fini,  mais  devient  très  grand  ;  on  n'a  plus  alors  qu'une 
expression  approchée  de  la  probabilité  par  la  loi  des  grands 
nombres,  le  théorème  de  Bernouilli,  etc.  C'est  ce  qui  se 
présente  en  statistique. 

Dans  une  troisième  catégorie,  le  nombre  des  cas  possibles 
est  infini. 

Ainsi,  on  lance  une  aiguille  sur  une  feuille  de  papier  où 
sont  tracées  des  lignes  parallèles  :  la  probabilité  pour  que 
l'aiguille  rencontre  une  de  ces  lignes  dépend  d'un  nombre 
infini  de  cas  possibles . 

C'est  dans  ce  cas  surtout  qu'il  faut  définir  avec  le  plus 
grand  soin  les  conventions  préalables. 
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On  sait,  par  exemple,  qu'un  nombre  x,  fractionnaire  ou 
incommensurable,  est  compris  entre  0  et  1,  et  on  demande 

1 

la  probabilité  pour  qu'il  soit  compris  entre  0  et  -:  le  nombre 

des  cas  possibles  est  infini.  On  serait  (enté  de  dire  que  la 

probabilité    est-;  cependant   ou   pourrait    dire    aussi    ipu; 

i  .  .  1 

si  0  <  a:  <  -'  le  carré  de  ce,  soil  y,  est  compris  entre  0  et  -• 

Puisque  x^  =  //,  el  que  x  est  compris  entre  0  et  1,  on  a 
0  <  y  <  1.  Les  cas  favorables  sont  tous  ceux  pour  lesquels 

1      . 

0  <  y  <   -;  si  l'on  divise  l'intervalle  compris  entre  0  et  1  en 

quatre  parties  égales,  la  probabilift'  pour  que  y  soit  compris 

1        1 

entre  0  et  -,  est  -■- 
4         4 

Ce  serait  pourtant  une  erreur  grossière  d'évaluer  égale- 

1  ...  \ 

ment  à  -  la  probabilité  pour  que  x  soit  compris  entre  0  et  -• 

En  effet,  dans  la  première  évaluation,  nous  considérons 
comme  également  probables  les  deux  bypothèses 

l'intervalle  e  étant  le  même  ;  tandis  que,  dans  la  seconde 
évaluation,  nous  considérons  comme  également  probables 
les  deux  hypothèses 

Xq^  <  o;^  <  Xq^  -f-  e         et         x^^  <  x^  <l  x,-  -f  e  ; 

ces  deux  conventions  sont  contradictoires. 

Ici,  X  est  une  constante  arbitraire  ;  plus  haut,  dans  le  pro- 
blème de  l'aiguille,  il  y  avait  trois  constantes  arbitraires,  les 
coordonnées  du  milieu  de  l'aio-uille  et  sa  direction.  Dans 
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d'autres  problèmes  de  probabilités,  il  y  a  encore  plus  de 
constantes  arbitraires,  il  y  a  même  des  lois  arbitraires. 
y  =  f  {x)  est  une  fonction  qui  peut  paraître  plus  probable  que 
telle  autre,  ce  qui  arrive  entre  autres  quand  on  interpole. 
C'est  là  une  quatrième  catégorie  de  problèmes. 

7.  Plaçons-nous  à  un  autre  point  de  vue. 

Une  question  de  probabilités  ne  se  pose  que  par  suite  de 
notre  ignorance  :  il  n'y  aurait  place  que  pour  la  certitude  si 
nous  connaissions  toutes  les  données  du  problème.  D'autre 
part,  notre  ignorance  ne  doit  pas  être  complète,  sans  quoi 
nous  ne  pourrions  rien  évaluer.  Une  classification  s'opérerait 
donc  suivant  le  plus  ou  moins  de  profondeur  de  notre  igno- 
rance. 

Ainsi  la  probabilité  pour  que  la  sixième  décimale   d'un 

nombre  dans  une  table  de  logarithmes  soit  égale  à  6  est  a 

1 

priori  de  —  ;  en  réalité,  toutes  les  données  du  problème  sont 

bien  déterminées,  et,  si  nous  voulions  nous  en  donner  la 
peine,  nous  connaîtrions  exactement  cette  probabilité.  De 
même,  dans  les  interpolations,  dans  le  calcvd  des  intégrales 
définies  par  la  méthode  de  Cotes  ou  celle  de  Gauss,  etc. 

Notre  ignorance  est  plus  grande  dans  les  problèmes  de 
physique  ;  il  s'agit  de  prévoir  un  événement,  c'est-à-dire  un 
phénomène  conséquent  qui  dépend  d'une  part  d'un  phéno- 
mène antécédent,  et  d'autre  part  de  la  loi  qui  unit  l'antécé- 
dent au  conséquent.  11  peut  se  faire  que  nous  connaissions 
la  loi,  mais  non  le  phénomène  antécédent  :  quelle  est  la 
probabilité  pour  que  se  produise  le  phénomène  conséquent? 

Nous  connaissons,  par  exemple,  la  loi  du  mouvement  des 
molécules  ;  si   nous  connaissions   exactement  leur  position 
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initiale,  nous  serions  capables  de  dire  où  elles  seront  à  un 
moment  donné  ;  la  probabilité  pour  que  ces  molécules 
occupent  telle  p(»sition  finale  dépendra  donc  de  la  probabilité 
que  nous  attribuerons  par  convention  à  telle  ou  telle  position 
initiale.  Dans  cliaquc  cas  une  liy[)Othèse  particulière  est 
nécessaire. 

Ainsi,  (piand  on  cherche  la  probabilité  pour  que  les 
comètes  aient  des  orbites  eili[)tiques,  ou  est  obligé  de  faire 
une  convention,  on  suppose  quk  une  grande  distance  du 
soleil  ces  ast)-es  sont  uniformément  distribués  dans  l'espace 
ainsi  que  les  directions  de  leurs  vitesses. 

Autre  question  analogue  :  les  lacunes  qu'offre  la  série  des 
petites  planètes  sont  elles  dues  au  hasai-dy  Ici  encore  leurs 
positions  initiales  sont  inconnues,  mais  l'astronome  connaît 
la  loi  de  leur  mouvement.  Comment  choisir  dans  ce  cas  les 
conventions  à  faire  sur  les  positions  initiales  ? 

11  est  difficile  de  le  faire  sans  tomber  dans  l'arbitraire. 
Cependant,  certaines  hypothèses  semblent  tout  à  fait  impro- 
bables :  on  n'admettra  pas  que  les  vitesses  initiales  des 
comètes  soient  telles  qu'elles  aient  toutes  la  même  excen- 
tricité. 

D'un  autre  côté  il  peut  arriver  que  certains  résultats 
soient,  dans  une  certaine  mesure,  indépendants  de  la  loi 
admise  pour  relier  les  antécédents  et  les  conséquents.  Con- 
sidérons un  très  grand  nombre  de  petites  planètes,  dont  les 
moyens  mouvements  soient  tous  différents  :  les  rayons  vec- 
teurs, les  longueurs,  les  vitesses  initiales  sont  distribués  d'une 
façon  quelconque.  Au  bout  d'an  tenq)s  très  long,  ces  petites 
planètes  seront  également  réparties  dans  tous  les  azimuts. 
Il  y  en  aura  un  même  nombre  dans  des  secteurs  égaux. 
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8.  Dans  d'autres  problèmes  enfin,  il  peut  arriver  que 
notre  ignorance  soit  plus  grande  encore,  que  la  loi  elle- 
même  nous  échappe.  La  définition  des  probabilités  devient 
alors  presque  impossible.  Si,  par  exemple,  x  est  une  fonc- 
tion inconnue  de  t,  nous  ne  savons  pas  très  bien  quelle  pro- 
babilité il  faut  attribuer,  au  début,  à  x^^  pour  connaître 


X 


xdl . 


On  se  laissera  souvent  guider  par  un  sentiment  vague  qui 
s'impose  avec  puissance,  qu'on  ne  saurait  pourtant  justifier, 
mais  sans  lequel  en  tout  cas  aucune  science  ne  serait  pos- 
sible. Les  lois  les  mieux  étaljlies  ne  le  sont  que  par  des 
expériences  isolées  dont  on  a  été  obligé  de  généraliser  les 
résultats.  Quand  Kepler  déduisait  ses  lois  des  observations 
de  Tycho-Brahé,  on  aurait  pu  lui  objecter  :  a  Tycho-Brahé 
n'a  pas  toujours  regardé  le  ciel,  et,  pendant  qu'il  ne  l'obser- 
vait pas,  la  loi  que  vous  cherchez  n'a-t-elle  pas  changé  ?  » 

Il  aurait  certainement  trouvé  l'objection  ridicule  et  aurait 
répondu  :  «  Cette  hypothèse  est  bien  invraisemblable.  »  C'eût 
été  là  faire  appel  à  ce  sentiment  mal  défini  de  la  probabilité. 

9.  Un  problème  plus  délicat  que  celui  de  la  probabilité 
des  effets  est  celui  de  la  probabilité  des  causes. 

Dans  notre  urne  de  tout  à  l'heure,  nous  savions  qu'il  y 
avait  n  boules  blanches  et  p  boules  noires  ;  quand  nous  cher- 
chions la  probabilité  de  tirer  une  blanche,  la  cause  était  con- 
nue :  c'était  une  urne  avec  n  blanches  etp  noires. 

Mais,  problème  inverse,  je  puis  savoir  qu'il  y  a  en  tout 
n  -}-p  boules  sans  connaître  comment  elles  sont  réparties.  Je 
tire  une  noire  :  quelle  est  la  probabilité  pour  qu'il  y  ait  plus 
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de  noires  que  do  blanches?  Ccsi  une  probabilité  de  cause. 
On  en  recherche  constamment  de  pareilles  en  physique  ; 
les  lois  ne  nous  sont  connues  que  par  leurs  effets  qu'on 
observe.  Chercher  à  en  déduire  les  lois  qui  sont  des  causes, 
c'est  résoudre  un  problème  de  probabilité  des  causes. 

10.  Sans  insister  davantage  sur  le  côte  métaphysique  des 
questions  de  probabilités,  et  dans  le  seul  but  de  provoquer 
vos  réflexions  sur  ce  sujet,  je  vous  ferai  encore  remarquer 
qu'une  probabilité  peut  être  subjective.  L'on  a  des  raisons 
personnelles  de  croire  telle  hypothèse  plus  probable  que  telle 

autre. 

La  probabilité  peut  aussi  s'objectiver,  en  statistique  par 
exemple:  le  nombre  probable  des  personnes  qui  mourront 
dans  une  année  est  tant  ;  cependant  il  s'en  écartera  un  peu. 
Dans  quelles  limites  nos  prévisions  seront-elles  vérifiées  ? 
Pourquoi  seront-elles  vérifiées  ? 

Il  y  a  là  quelque  chose  de  mystérieux,  d'inaccessible  au 
mathématicien. 

Quoi  qu'il  en  soit,  Tordre  que  je  suivrai  dans  l'exposé 
mathématique  des  probabilités  sera  celui  que  jai  indiqué 

plus  haut. 

Je  commencerai  par  des  problèmes  où  les  cas  possibles  sont 
en  nombre  limité  ;  puis  j'étudierai,  au  sujet  des  cas  en  nombre 
très  grand,  le  théorème  de  Bernouilli  et  ses  conséquences,  la 
probabilité  des  causes,  les  problèmes  où  entrent  des  cons- 
tantes arbitraires:  le  nombre  des  cas  devenant  infini,  j'expo- 
serai la  théorie  des  erreurs,  branche  fort  importante,  et 
j'apprendrai  enfin  à  déterminer' des  lois  ou  des  fonctions 
arbitraires. 
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1.  Le  calcul  des  probabilités  repose  sur  deux  théorèmes: 
le  théorème  des  probabilités  tolales  ;  le  théorème  des  proba- 
bilités composée?. 

Au  sujet  de  deux  événements  A  et  B,  on  peut  se  poser 
divers  problèmes  de  probabilité,  suivant  que  Fun  de  ces  évé- 
nements doit  se  [)roduire,  ou  tous  les  deux,  ou  aucun. 

Ou  bien  A  et  B  se  produiront  tous  deux,  hypothèse  que 
j'appellerai  AB  ; 

Ou  bien  A  se  produira,  B  ne  se  produira  pas,  hypothèse 
que  j'appellerai  AB'  ; 

Ou  bien  A  ne  se  produira  pas,  B  se  produira,  hypothèse 
que  j'appellerai  yV'H  ; 

Ou  bien  ni  A,  ni  B  ne  se  produira,  hypothèse  que  j'appel- 
lerai A'B'. 

Supposons  que  A  B  se  réalise  dans  a  cas  difîérents 
»  A  B'  »  p  » 

»  A  B  »  Y  » 

»  A'B'  »  o  » 

Le  nombre  lotal  des  cas  possibles  est  a  +  [i  +  y  +  2'  '1^'^ 
l'on  suppose  par  convention  également  probables. 
Examinons  diverses  probabilités. 
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La  probabilité  pour  que  A  se  produise  est 

(A)  2>,  -  T^râqrT^Ts' 

les  cas  favorables  étant  AB  et  AB'. 

La  probabilité  pour  que  B  se  produise  est 

fB)  P.  =  7+7+7+^^' 

La  probabilité  pour  que  l'un  des  deux  au  moins  se  produise 
est 

(A  ou  B)  P3  -  .^  a_  à  +  Y  -f-  V 

les  trois  premières  hypothèses  AB,  AB'  et  A'B  étant  favo- 
rables. 

La  probabilité  pour  que  les  deux  se  produisent  est 


(A  et  B,  P; 


-+-  ?  +  5  4-  Y 


une  seule  hypothèse,    AB  étant  favorable. 

Nous  avons  encore  à  envisager  la  probabilité  pour  que  A 
se  produise  si  B  s'est  produit  : 

(A  si  B,  ?'5  =  .Tip;  ' 

nous  savons  d'avance  «lue  B  s'est  produit,  par  suite  le  nombre 
des  cas  possibles  se  réduit,  ainsi  que  celui  des  cas  favorables. 
La  probabilité  pour  que  A  se  produise  si  B  ne  s'est  pas 
produit  est 

(A  si  B')  Po  ^  ^r^; 

les  cas  possibles  étant  au  nond)re  de  ';  -|-  5. 
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La  probabilité  pour  que  B  se  produise  si  A  s'est  produit  est 

(B  si  A)  Vi  =  ^rpp"      ■ 

La  probabilité  pour  que  B  se  produise  si  l'on  sait  que  A 
ne  s'est  pas  produit  est 

(Bsi  A')  p^ '^- — 


y  +  8 

2.  Les  théorèmes  annoncés  se  réduisent  à  de  simples 
identités. 

Examinons  p,,  p^,  P3,  p^.  Oa  a  : 

P<  +  P2  =  P3  +  P.', 
a  oc  a  4-  y  

de  même 

P.',  =P\Pt 

Ainsi  la  somme  des  probabilités  pour  que  A  se  produise  et 
pour  que  B  se  produise  est  égale  à  la  somme  des  probabili- 
tés pour  que  l'un  des  deux  au  moins  se  produise  et  pour  que 
tous  les  deux  se  produisent. 

La  probabilité  pour  que  A  et  B  se  produisent  tous  deux 
est  égale  à  la  probabilité  pour  que  B  se  produise,  multipliée 
par  la  probabilité  pour  que  A  se  produise  quand  on  sait  que 
B  s'est  produit. 

Ou,  inversement,  elle  est  égale  à  la  probabilité  pour  que 
A  se  produise,  multipliée  par  la  probabilité  pour  que  B  se 
produise  quand  on  suppose  que  A  doit  se  produire. 
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3.  Supposons,  on  particulier,  a  :=  o,  d'où  p^  ^  o,  alors 

P(  +  Pi  =  P:v 

Lorsque  les  deux  ('vénements  ne  peuvent  arriver  tous  deux 
à  la  fois,  la  prohabililô  de  A  et  celle  de  B  oui  pour  somme 
la  probabilité  pour  que  1  un  quelconque  se  produise. 

Ainsi,  quand  un  événement  peut  se  produire  de  deux 
manières  différentes,  mais  que  ces  deux  manières  ne  peuvent 
arriver  simultanément,  la  probabilité  de  l'arrivée  de  cet  évé- 
nement est  égale  à  la  somme  de  la  probabilité  pour  (|u'il  se 
produise  de  la  première  manière  et  de  la  probabilité  pour 
qu'il  se  produise  de  la  deuxième  manière. 

C'est  le  théorème  des  probabilités  totales. 

4.  Il  peut  arriver  que  p~  =  p^ . 

î'  -h  Y       ^  + 
d'où 


»  -f-  Y 

^  +  P  +  Y 

+  5 

a  +  Y 

= 

a  +  6  +  Y 

+  5 

a 

-.  +  B 

\   -L 

y 

-..i-ï  + 

5 

a  -f"  f^  Y  "f"  ° 


X  y 


Quand  cette  dernière  condition  est  remplie,  on  a  Pj  =7)5; 
on  a  aussi  ;),  =  p^,  en  permutant  a  avec  p,  y  avec  8;  on  a 
encore  p.,  =  p^,  car  p^   se  permute,  avec  p.^  et  p^  avec  p^;  de 
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Ainsi  : 

Pi  —Vi=  1\- 

En  d'autres  ternies,  la  probabilité  pour  que  A  se  produise 
reste  la  même  si  l'on  sait  que  B  s'est  produit  ou  si  l'on  sait 
que  B  ne  s'est  pas  produit;  ou,  enfin,  la  probabilité  de  A  est 
indépendante  de  B. 

On  dit  que  les  deux  événements  sont  indépendants. 

De  pj  =  P|,  on  déduit 

Vk  =  P\V-i  '■ 

la  probabilité  pour  que  les  deux  événements  se  produisent, 
s'ils  sont  indépendants,  est  le  produit  de  îa  probabilité  de 
chacun  des  deux  événements. 

C'est  le  théorème  des  probabilités  composées. 

5.  Dans  un  jeu  de  32  cartes,  on  tire  2  cartes. 

La  probabilité  pour  que  la  première  soit  un  roi  est 

1 

la  probabilité  pour  que  la  seconde  soit  un  roi  est 

1 

P.  =  -^\ 

la  probabilité  pour  que  les  deux  cartes  tirées  soient  précisé- 
ment deux  rois  est 

4  >ç^3^ 

On  cherche  parmi  tous  les  arrangements  des  cartes  deux 
à  deux,  soit  32  X  31, ceux  qui  sont  favorables  à  l'événement: 
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il  y  en  a  4x  3,  car  il  y  a  4  rois  dans  le  j'en,  el  on  peut  former 
avec  eux,  2  à  2,  autant  d'arrangements  (iifavec  4  lettres  2 
à  2. 

La  probabilité  pour  que,  dans  les  2  cartes,  il  y  ait  au  moins 
un  roi  est 

,  8  X  31  —  12 

Vz  =P\-\-  P-2  —  Pu  =      3.)     -  .jj 

Il  faudrait  se  garder  de  dire  que  la  probabilité  pour  que 
l'on  ait  au  moins  un  roi  est  le  double  de  la  probabilité  pour 
que  l'on  ait  un  roi. 

Une  urne  renferme  K  boules  numérotées  de  1  à  K.  Si  l'on 
clierche  la  probabilité  d'amener  le  N°  1  en  tirant  deux  boules 
à  la  fois,  le  1  peut  figurer  soit  sur  la  première  boule,  soit  sur 
la  seconde  ;  les  deux  événements  sont  incompatibles,  et  la 
probabilité  totale  est  : 

Revenons  aux  rois  du  jeu  de  cartes.  Les  événements  sont- 
ils  indépendants  ? 

On  n'a  pas  p,^  =  p,  p,,  mais  pj  =r  p,  p.. 

En  se  reportant  à  la  signification  de  p-,  on  voit  que,  si 
le  premier  événement  A  s'est  produit,  il  ne  reste  que  trois 
rois  et  31  cartes,  et  la  probabilité  pour  que  B  arrive  est 

_  3^ 
31 

Ainsi  : 

4X3 


Pi  = 


32  X  31 

OALCIL    DES    PBOBABILITÉS. 
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Autre  exemple  crévénements  indépendants:  je  jette  2  dés; 
quelle  est  la  probabilité  que  chacun  amène  6  ? 

1 

La  probabilité  que  l'un  amène  6  est  j:;  ; 

1 

—  1  autre  —         ■^' 

b 

1 

La  probabilité  que  tous  deux  amènent  6  est  r^i  car  les 

deux  événements  sont  indépendants. 

6.  Celte  condition  n'est  pas  toujours  aussi  évidente,  et  on 
pourrait  faire  de  ce  théorème  un  usage  illég-itime  qui  s'est 
rencontré  plusieurs  fois. 

Au  tir  au  pistolet,  je  cherche  la  loi  probable  des  écarts:  je 
ne  me  suis  rien  donné,  ni  sur  le  tireur  ni  sur  le  pistolet. 
C'est  une  question  dans  le  goût  de  «■  l'âge  du  capitaine  », 

Prenons  cependant  deux  axes  de  coordonnées,  ayant  pour 
origine  le  centre  de  la  cible  :  soient  oc  ei  y  les  coordonnées 
rectangulaires  d'un  poijit  M,  p  et  to  ses  coordonnées  po- 
laires. 

Le  problème  reste  indéterminé,  si  nous  admettons  que  la 
probabilité  des  écarts  est  la  même  dans  toutes  les  directions, 

La  probabilité  que  M  se  trouve  dans  un  petit  élément  de 
surface  da  peut  se  figurer  par 

/■{x,  y)  cl':. 

Il  faut  déterminer  f  [x,  y)  ;  f  [x,  y)  ne  doit  dépendre  que 
de  p  pour  que  la  probabilité  reste  la  même  dans  toutes  les 
directions  :  cette  })robabilité  s'écrira  donc 
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Clierchons  la  probabilité  pour  fjue  labscisse  du  |)()iiil  de 
chute  soit  comprise  entre  x  et  x  -{-  dx;  elle  se  représentera 
par 

■b  {x)  dx. 

De  même,  la  probabilité  pour  (pie  l'ordonnée  du  point  de 
chute  soit  comprise  entre  y  ^\.  y  -\-  dy  se  représentera  par 

'\  [y)  dy. 

Mais  on  doit  supposer  que  ç.  et  l  sont  égaux  pour  que  la 
probabilité  reste  la  même  dans  toutes  les  directions  ;  dans  le 
second  cas,  on  aura  donc 

?  [y)  dy. 

Le  raisonnement  va  devenir  incorrect  :  clierclions  la  pro- 
babilité pour  que  M  se  trouve  dans  un  petit  rectangle  de 
dimensions  dx  et  dy.  Deux  événements  doivent  se  pro- 
duire à  la  fois  :  1°  l'abscisse  est  comprise  entre  x  ei  x  ■\-  dx\ 
2°  l'ordonnée  est  comprise  entre  y  et  y  -f-  dy. 

En  vertu  du  théorème  des  probabilités  composées,  la  pro- 
babilité actuelle  sera 

cp  [pc]  3.  (?/)  dx  dy. 

D'autre  part,  cette  probabilité  sexprime  par  /"  (p)  dz  ;  on 
a  donc  : 

?  N  ?(y)  =  /"(?)• 

Prenons  les  dérivées  logarilhmi({ues  des  deux  membres 
par  rapport  à  ^,  en  tenant  compte  de  p  r=:  y'a?-  -\-  y- . 

^'  [pc)  __  f  (p)  X 
?  (•»)        f  (p)  ? 
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Ainsi  : 


et  par  analogie  : 


X'^  [x]         ^f  (p) 


?'  [y)  _  r  (p) 
2/?  {y)     9f  (?) 


Le  premier  membre  de  chacune  de  ces  équations  dépend 
sciil  de  iT,  soit  dey;  comme  ils  sont  égaux,  ils  sont  cons- 
tants. 


X'^  [X) 


hx" 
loge  cp  [x)  ■-=  -^  -\-  log.  C 


cp  (a?)  =  Ce  ^  . 

Ce  raisonnement  est  incorrect  :  on  a  appliqué  le  théorème 
des  probabilités  composées,  c'est-à-dire  qu'on  a  supposé  les 
événements  indépendants  ;  autrement  dil,  que  les  écarts 
suivant  l'axe  des  x  sont  indépendants  des  écarts  suivant 
l'axe  des  y. 

Décrivons  quatre  aires  égales  à  <:/<!  autour  des  quatre  som- 
mets A,  B,  C,  D  d'un  rectangle  dont  les  côtés  sont  paral- 
lèles aux  axes.  Appelons  a,  p,  y,  o  les  probabilités  respec- 
tives pour  que  M  tombe  dans  chacun  de  ces  éléments. 

J'ai  supposé  que  l'écart  en  ordonnée  était  le  même  pour  B 
et  D,  situés  sur  la  même  parallèle  à  l'axe  des  x;  que  l'écart 
en  abscisse  était  le  même  pour  A  et  B,  situés  sur  la  même 

parallèle  à  l'axe  des  y  ;  en  d'autres  termes  que  -  =-^)  ce  qui 

est  une  hypothèse  absolument  gratuite. 
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7.  Maxwell  a  (•((iniiiis  la  même  erreur  dans  la  tlu'orie  des 
gaz.  Considérons  un  g'az  comme  formé  d'un  très  grand 
nombre  de  molécules  animées  de  vitesses  différentes;  com- 
ment les  vitesses  seronl-elles  distribuées  entre  les  molé- 
cules ? 

Choisissons  trois  axes  de  coordonnées  rectangulaires,  et 
par  l'origine  menons  un  vecteur  représentant  en  grandeur, 
direction  et  sens,  la  vil(>sse  de  ces  molécides.  Évaluons  la 
probabilité  pour  que  l'extrémité  du  vecteur  M  se  trouve 
dans  un  petit  élément  de  volume  dr. 

Si  je  suppose,  ce  qui  est  naturel,  les  vitesses  susceptibles 
de  toutes  les  directions,  cette  probabilité  se  représentera 
par 

r{r)dT. 

I.a  probabilité  pour  que  la  première  coordonnée  soit  entre 
X  ei  X  -\-  dx  s'écrira  cp  [x)  dx  ;  la  probabilité  pour  que  la 
seconde  coordonnée  soit  entre  y  qV  y  -\-  dy  s'écrira  cp  [y]  dy  ; 
la  probabilité  pour  que  la  troisième  coordonnée  soit  entre 
z  et  z  -{-  dz  s'écrira  cp  [z)  dz, 

La  probabilité  pour  que  M  soit  dans  un  petit  parallélipi- 
pède  de  côtés  parallèles  aux  axes  étant/  (r)  dx  dy  dz,  si  le 
théorème  des  probabilités  composées  était  applicable,  on 
aurait  comme  tout  à  l'heure 

ce  qui  est  incorrect. 

8.  Parlons  maintenant  du  problème  du  scrutin,  dont  une 
solution  élégante  est  due  à  M.  André. 

Deux  candidats  A  et  B  sont  en  présence  ;  un  électeur  bien 
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informé  sait  à  l'avance  que  A  aura  m  voix  et  B  w  voix,  m 
étant  plus  grand  que  n.  On  demande  la  probabilité  pour  que 
A  garde  la  majorité  pendant  tout  le  dépouillement  du  scrutin. 
Pour  évaluer  le  nombre  des  cas  possibles,  constatons  que 
les  m  bulletins  A  et  les  n  bulletins  B  peuvent  se  présenter 
dans  autant  d'ordres  différents  qu'il  y  a  de  permutations 
avec  répétition  de  m  lettres  A  et  n  lettres  B,  soit 

7)1  -\~  n  ! 

m  l  ni 

Je  partage  ces  cas  possibles  en  trois  groupes. 

Dans  le  premier,  je  range  tous  les  cas  où  A  a  la  majorité 
au  début  et  la  conserve  tout  le  temps,  soitN,  cas  tous  favo- 
rables. 

Dans  le  deuxième,  je  range  tous  les  cas  où  le  premier  bul- 
letin est  un  bulletin  B  ;  A  perd  donc  la  majorité  au  début  ;  ce 
sont  No  cas  défavorables. 

Dans  le  troisième,  je  range  tous  les  cas  où  A  a  la  majorité 
au  début,  mais  la  perd  ensuite  avant  de  la  retrouver  à  la 
fin;  ce  sont  N3  cas  défavorables. 

On  a 


N,  +  N,  +  N3  = 


I  1)  I 


m  !  n 

et  il  s'agit  de  calculer  : 

N. 
N,  -f  N,  +  N, 

Évaluons  N,  :  le  premier  bulletin  dépouillé  porte  B  ;  sup- 
primons-le, il  reste  m  bulletins  A  et  {n  —  1)  bulletins  B.  Le 

in  — (—  H  — ^  \  ! 

nombre  des  cas  possibles  est ; ry-'  et  donne  la  va- 

^  min  —  1  ! 

leur  de  N,. 
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Je  vais  démontrer  que  N3  =  Xo. 

Lemme.  —  Supposons  qu'il  y  ait  égalité  do  voix  dans  le 
scrutin  :  A  a  ^  bulletins,  B  a  q  bulletins.  Admettons  égale- 
ment que  A  a  la  majorité  au  début,  et  qu'il  la  conserve  jus- 
qu'au dernier  bulletin,  où  il  la  perd,  puisqu'il  y  a  linalement 
égalité  ;  le  dernier  bulletin  est  donc  au  nom  de  B.  Dépouil- 
lons dans  l'ordre  inverse:  B  perdra  la  majorité  au  dernier 
bulletin  seulement. 

A  un  moment  déterminé  du  scrutin,  on  a  dépouillé  a  bulle- 
tins A  et  b  bulletins  B,  et  l'on  a  trouvé  a  ^  b,  puisque  A  a 
la  majorité.  Il  reste  à  dépouiller  q  —  a  bulletins  A  et  g  —  b 
bulletins  B. 

Dans  l'ordre  inverse,  le  scrutin  aurait  donc  montré  : 

q  —  b  >  q  ~  a, 

c'est-à-dire  que  B  aurait  eu  la  majorité. 

Ce  lemme  établi,  revenons  au  problème  qui  nous  occupe. 
Considérons  une  combinaison  a  du  troisième  groupe 

OL  AABAB  I  BABAA. 

A  a  la  majorité  jusqu'au  trait,  puis,  au  bulletin  suivant,  il 
la  perd  pour  la  première  fois.  A  gauche  du  trait,  s'il  y  a  q 
bulletins  A,  il  y  a  ^  —  1  bulletins  B,  soit  en  tout  2q  —  1 
bulletins. 

Considérons  une  autre  combinaison  que  nous  appellerons 

«  dérivée  de  a  ». 

BABAA  I  AABAB. 

On  l'obtient  en  prenant  successivement  dans  a  les  bulle- 
tins de  rang 

27,  2q  -f-  1,  2f/  +  i2,  ...,  >w-fn,  1,  2,  ...,  2g—  1. 
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c'est-à-dire  en  transportant  à  gauche  du  trait  ce  qui  était  à 
droite,  et  inversement. 

Le  (2ç)°  bulletin  étant,  par  définition,  le  premier  qui  fait 
perdre  à  A  sa  majorité,  chaque  combinaison  a  aune  dérivée 
et  une  seule. 

Considérons  maintenant  une  combinaison  [i  du  second 
groupe  :  elle  commence  par  B. 

^  BABAAABA. 

A  a  la  majorité  à  la  fin. 

Formons  une  combinaison  js'  de  la  manière  suivante  : 
d'abord  le  premier  bulletin  B,  puis  le  dernier  bulletin  de  ,8, 
puis  le  pénultième,  etc.,  c'est-à-dire  les  bulletins  de  p  en 
ordre  inverse  jusqu'au  second. 

p'  BABAAABA 

Il  est  clair  que  B  a  d'abord  la  majorité,  puisqa'il  finit  par 
la  perdre. 

Supposons  que  le  (2p)*  bulletin  fasse  perdre,  pour  la  pre- 
mière fois,  la  majorité  à  B;  ici,  c'est  le  second. 

La  combinaison  fi'  sert  à  'définir  le  nombre  p  :  il  n'y  en  a 
qu'un. 

Le  bulletin  qui  occupe  dans  p'  le  (2^3)'^  rang  occupe  dans  p 
le  [m  4-^^+2  —  '^pY  rang. 

Dans  S,  je  place  un  trait  avant  le  terme  qui  occupe  ce  rang: 

p  BABAAAB  |  A 

Considérons  enfin  la  combinaison  suivante,  que  je  dési- 
gnerai par  Y  et  que  j'appellerai  la  dérivée  de  [il  ;  je  commence 
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par  les  bullclins  à  droite  du  trait  (ici  il  n'y  en  a  qu'niij,  et  jo. 
reprends  tous  ceux  qui  sont  à  gauche. 

Y  A  I  BABAAAB 

Les  bulletins  de  f>  ont  été  pris  ainsi  dans  l'ordre  : 

m-\-n-\-2  —  2p,  ...,m-|-y/,  1,:2,  ...,}n-\-)i  —  ip,m-\-7i-\-i  —2p. 

Je  dis  que  cette  dérivée  appartient  toujours  au  troisième 
groupe. 

D'abord  le  (m  -{- 7i  -{-  i  —  ^p]^  .'.ulletin  doitêtre  A,  puisque 
dans  p'  il  fait  perdre  la  majorité  à  B  ;  donc  y  commence 
par  A. 

A  ne  conservera  pas  tout  le  temps  la  majorité.  En  effet, 
les  2p  premiers  l)ulletins  de  y  sont,  dans  un  ordre  différent, 
les  2p  premiers  bulletins  de  6':  et  par  hypothèse,  après  le 
dépouillement  de  ces  2yj  bulletins,  il  y  avait  égalité  entre 
les  deux  candidats. 

Donc,  dans  y,  A  aura  perdu  la  majorité  et  y  appartiendra 
au  troisième  groupe. 

Ainsi,  toute  combinaison  du  second  groupe  a  une  dérivée, 
et  une  seule  appartenant  au  troisième  groupe. 

Si,  pour  une  combinaison  a  appartenant  au  troisième 
groupe,  je  forme  sa  dérivée  p,  puis  la  dérivée  de  p,  je  dis 
que  je  retombe  sur  a. 

Démontrons  que  le  5'  de  a  correspond  au  p  de  8. 

En  effet,  formons  p' 

p'  BBABAA  i  AABA. 

Si  je  prends  les  '2q  premiers  bulletins  de  p',  ce  sont  pré- 
cisément les  2q  premiers  bulletins  de  x  dépouillés  dans  un 
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ordre  inverse,  et,  d'après  le  lemme,  B  n'y  perdra  la  majorité 
qu'à  la  fin;  or,  nous  savons,  d'autre  part,  que  B  ne  perd  la 
majorité  dans  fi'  qu'au  [^p)'  bulletin;  donc 

P  =  9 

et  la  déri-'^ée  de  p  sera  a. 

Si  j'ai  affaire  à  une  combinaison  p,  j'en  forme  la  dérivée  y  : 
réciproquement  la  dérivée  de  [i  sera  a. 

On  peut  dire  que  les  combinaisons  du  second  groupe  sont 
conjuguées  avec  celles  du  troisième,  de  telle  façon  que 
chaque  combinaison  d'un  groupe  soit  la  dérivée  de  sa  con- 
juguée de  l'autre  groupe. 

Donc  : 

N3  =  N, 

N..  +  X3^  a'" +  "-/,', 

^  m  In  —  1  ! 

X,  +  N3 2n 

N,  +  No  -f  N3  ~  m  +  n 

C'est  la  probabilité  que  A  n'aura  pas  toujours  la  majorité; 

et 

N,  .  '■In  m  —  n 

=  1 


N,  +  N2  +  N3  ?/i  +  n        m  -\-  n 

est  la  probabilité  qu'il  la  gardera  tout  le  temps. 
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1.  Appliquons  à  (juolques  problèmes  simples  les  principes 
précédents. 

Problème  des  dés.  —  On  jette  n  dés  et  on  demande  la 
probabilité  d'amener  un  point  total  égal  à  K. 

Supposons  d'abord  qu'il  ne  s'agisse  que  de  deux  dés;  avec 
chacun  d'eux,  six  cas  différents  peuvent  se  présenter,  et  les 
deux  réunis  offrent  trente-six  combinaisons. 

1  \ 

12  2  1 

13  2  2 

14  .    ,  etc. 
15 

16 

2  6 

Une  seule    correspond  au  point     K  =  2 

2  correspondent  au  point.     .     .     K  =  3 

3  ~  K  =  4 

1  —  K  =  12 

1 

La  probabilité  d'amener  2  est     .         — 

2 

""         ~      '"^  ~   '      à 

-         4-     .         -^■.. 
36 
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Prenons  le  problème  plus  général  de  n  dés;  le  nombre  total 

des  cas  possibles  est  6"  :  en  effet,  soit  a,  a.^ a„  une  des 

combinaisons,  chacun  des  nombres  a  est  susceptible  de  six 
valeurs,  1,  2,  3...,  6;  donc  le  nombre  cherché  est  celui  des 
combinaisons  avec  répétition  de  six  lettres  n  à  >«,  soit  6'\ 

Le  point  total  devant  être  un  nombre  donné  à  l'avance,  K, 

=^1   -f-  '^■i  H-   •■•   +  <^n  =  K. 

Considérons  l'un  des  6"  cas  possibles,  et  à  ce  cas  faisons 
correspondre  le  monôme 

/a,   /a.,  /a„ 

Faisons  la  somme  de  ces  monômes  en  faisant  varier  a, , 
a^,.  ...,  a„  de  1  à  6. 

S  /?!  Ip  ...  Ifn  —  n 

=(^+/f  +  -  +  'f:)('2+i4---+/^')  •••('.  +  <?.  +  ••• +'?.)• 

C'est  un  produit  de  n  facteurs;  faisons-y: 
Le  monôme  deviendra  : 
et  le  polynôme  H  se  réduira  à  : 

Soit  N  le  nombre  des  cas  favorables  ;  il  y  a  N  monômes 
égaux  k  t^ ,  leur  somme  est  N^'^ ,  et  si  l'on  fait  SN/"^ ,  pour 
toutes  les  valeurs  possibles  de  K  : 


TROISIÈME    LEÇON  29 

La  probabilité  demandée  est  ^z 

La  valeur  de  N  est  facile  k  calculer, 

II  est  la  puissance  n^  d'une  somme  de  termes  en  prog-res- 
sion  o^éométrique  : 

{t  —  t')"-  et  (1  —  t]-"  peuvent  se  développer  par  la  fornuile 
du  binôme;  en  faisant  le  produit  des  deux  développements, 
j'aurai  le  coefficient  de  t^ ,  c'est-k-dire  \. 

Reprenons  le  cas  de  deux  dés.  II  devient '/  —  '')"  (1  — 0~'i 
et  l'on  a  : 

(^_  t-/'  =  f'  —"It^  +  /''• 

(1  —  f2)-2  ^  ^  -\--2t  +  31-  -f- 

Évaluons  le  coefficient  de  l^  en  faisant  le  produit  de  ces 
deux  développements.  D'abord  K  ne  peut  dépasser  12  ;  puis 
nous  considérerons  deux  cas  suivant  que  le  point  est  de  2  à 
7  ou  de  8  à  12. 

Si  le  point  K  est  au  plus  égal  k  7,  K  <  8,  il  n'y  a  k  faire 
intervenir  ni  l'^  ni  <''  dans  le  premier  développement,  et 
l'on  n'aura  k  considérer  que 

f2  4-  9/3  ^  3^4  _^  _>_  Or. 

Ainsi  pour  les  points  2,  3,  4 ,  7,  X  a  les  valeurs  res- 
pectives 1,  2,  3,  ,  6. 

Si  K  est  égal  ou  supérieur  k  8,  il  ne  faut  pas  envisager  /'  ■, 
et  l'on  n'aura  affaire  qu'k  : 

l2    i  ,|_  -2/  -I-  )  —  2^s  [l  -f  2i  -f  )• 
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Le  coefficient  de  t^  dans  le  premier  monôme  sera  K  —  \ . 
Le  coefficient  de  t^  dans  le  second  monôme  sera  —   il  ; 
celui  de  i'\  —  4  ;  ...  celui  de  ^^,  —  2  (K  —  7).  Ainsi  : 

N  =  K  —  1  —  2  (K  —  7)  =  13  —  K. 

On   trouverait   des    expressions    plus    compliquées    pour 

w  >  2. 

2.  Problème  de  la  loterie.  —  Dans  une  urne,  il  y  a  ;/. 
boules  numérotées  de  1  à  (j.  ;  on  en  tire  »,  quelle  est  la  pro- 
babilité pour  qu'il  y  ait  K  boules  désignées  d'avance  ? 

Les  n  boules  tirées  portent  des  numéros  différents  entre 
eux  et  compris  entre  1  et  [jl. 

Les  cas  possibles  sont  en  môme  nombre  que  les  arrange- 
ments de  [/.lettres  n  à  n,  si  l'on  tient  compte  de  Tordre  de 
sortie  : 

g! 
ij.  —  n  \ 

Quand  il  reste  ;ji.  —  i  -\-  1  boules,  chacune  d'elles  a  môme 
chance  de  sortie  que  les  autres  ;  nous  supposerons  toutes 
les  sorties  également  probables. 

Si  on  ne  considère  pas  l'ordre,  le  nombre  des  cas  pos- 
sibles ne  sera  plus  que  celui  des  combinaisons  de  j.  lettres 

n  k  n. 

.,  t 


Je  ne  considère  plus  comme  distinctes  les  hypothèses  qui 
ne  diffèrent  que  par  l'ordre  de  sortie.  Toutes  les  combinai- 
sons restent-elles  également  probables  comme  les  arrange- 
ments? Oui,  car  chacune  correspond  à  n  !  arrangements. 
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Le  nombre  des  cas  favorables  est  celui  des  combinaisons 

où  entrent  les  K  boules  désig'nées  ;  il  en   reste,  après    leur 

suppression,  a  —  K  dans  l'urne.  Donc  le  nombre    des  cas 

favorables  est  le  nombre  des  combinaisons  de  u.  —  K  lettres 

n  —  K  à  il  —  K. 

UL  —  K  ! 
a  —  n\  n  —  K  ! 

La  probabilitf  d'amener  K    numéros  désignés  à  la  loterie 

est  donc  : 

'j.  —  K\  il] 
a!  n—  K!* 

3.  Problème  de  la  poule.  —  Trois  joueurs  A,  B,  C 
jouent  aux  conditions  suivantes.  Deux  d'entre  eux  A  et  B 
jouent  ensemble  ;  C  ne  joue  pas.  Le  perdant  sort  et  est  rem- 
placé par  C.  Après  chaque  partie,  le  perdant  est  remplacé. 
Le  jeu  prend  fin  quand  un  joueur  gag'ne  deux  fois  de   suite. 

On  suppose  naturellement  que  le  jeu  est  un  jeu  de  hasard, 

1 

et  que  la  probabilité  de  gagner  une  partie  est  -  pour  cliaque 

joueur. 

Par  exemple  on  peut  avoir  : 

l""*  partie  AB  ;       A  gagne  ; 

2^  partie  AC;       si  A  gagne,  il  est  le  gagnant  définitif; 

si  C  gagne,  B  rentre; 
3*   partie  BC;       si  C  gagne,  il  est  le  gagnant  définitif; 

si  B  gagne,  A  rentre  ; 
4"   partie  BA  ;       et  ainsi  de  suite. 

Admettons  que  A  ait  gagné  la  .première  partie.  On  de- 
mande la  probabilité  pour   chacun   des  joueurs  d'être  le  ga- 
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gnant  définitif.  Soit  x,  y,  z,  cette  probabilité  pour  A,  B,  C. 

Deux  hypothèses  sont  d'abord  possibles.  Si  A  gagne  la 
deuxième  partie,  c'est  le  gagnant  définitif,  et  les  probabi- 
lités des  trois  joueurs  deviendront  1 ,  0,  0. 

Si  A  perd,  A  prend  la  place  de  C,  B  se  trouve  dans  les 
conditions  de  A  et  C  rentre  comme  B;  les  probabilités  de- 
viennent z.  X,  y. 

Appliquons  le  théorème  des  probabilités  totales  et  le  théo- 
rème des  probaljilités  composées. 

A  peut  devenir  gagnant  définitif  par  deux  hypothèses 
qui  s'excluent  l'une  l'autre  : 

1°  En  gagnant  la  partie  considérée  ; 

2°  En  la  perdant. 

La  probabilité  pour  que  A  soit  gagnant  définitif  est  donc: 

B  ne  peut  gagner  que  d'une  manière  :  A  perd  la  partie 
considérée  et  B  devient  gagnant  définitif  ensuite. 

1 

y   =  Zy^- 

De  même  pour  C  la  probabilité  sera  : 


D'où  : 


1 


•^  —  7'  '^-7'  ^—7' 


On  remarquera    que  x  +  y  -\-  z  =  V  \    lorsqu'il  y  a  plu- 
sieurs événements  possibles  et  de   telle  façon  que  l'un  d'eux 
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et  un  seulement  doive  nécessairement  arriver,  la  somme  do 
leurs  probabilités  est  1,  mais  ce  n'est  pas  ici  absolument  le 
cas,  car  la  partie  pourrait  se  prolong-er  indéfiniment.  Ici 
notre  somme  est  l  parce  que  la  probabilité  pour  que  la  partie 
se  prolonge  indéfiniment  est  0. 

On  vient  de  supposer  que  A  avait  gagné  la  première 
partie.  Plaçons-nous  au  commencement  du  jeu;  avant  la 
première  partie,  C  est  dehors. 

Deux  hypothèses:  A  gagnera  ou  B  gagnera. 

Si  c'est  A,  B  sortira,  C  entrera  et  les  probabilités  pour 
chacun  deviendront 

4  -2  1 


Si  c'est  B,  elles  deviendront  : 

1  4  2 

7'       :'       r 

A  peut  devenir  gagnant  définitif:  soit  en  gagnant  la  pre- 
mière partie,  soit  en  la  perdant.  La  probabilité  de  la  première 
hypothèse  s'obtient  par  le  produit  de  la  probabilité  pour  A  de 

gagner  la  première  partie  et  de  la  probabilité  pour  devenir 

.14 

gagnant  définitif,  soit  -  X  -•  La  probabilité  de  la  seconde 

hypothèse  est  de  même  ^X  z' 

On  arrive  ainsi  aux  probabilités  totales  suivantes. 
PourA.^X-^  +  ^X.  =  ^-; 

Pour  B,  la  même,  —  ; 

4 
Pour  C,  sans  la  calculer  autrement  —  • 

14 
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4.  Espérance  mathématique.  —  A  un  certain  moment 
d'un  jeu,  lin  joueur  a  la  probabilité^  pour  qu'il  gagne; 
l'enjeu  à  empocher  est  a. 

Par  définition,  l'espérance  mathématique  est  pa.  Bien 
entendu,  si  a  est  une  perte,  pa  est  négatif. 

Si  plusieurs  hypothèses,  de  probabilités  respectives  p,, 
p.,,...  Pn:  amènent  des  gains  respectivement  égaux  à  a^,  «g,  .. 
a„,  la  définition  de  l'espérance  mathématique  sera  : 

Un  jeu  est  équitable  lorsque  l'espérance  m.athématique 
est  la  même  pour  tous  les  joueurs. 

Pour  faciliter  certaines  questions,  on  convient  d'introduire 
des  joueurs  fictifs  dont  on  évalue  l'espérance  mathématique. 

Soient  deux  événements,  A  et  B. 

La  probabilité  de  l'arrivée  de  A  est p, 

»  »  B  est P2 

»  »  A  ou  de  B  est p^ 

»  »  A  et  de  B  est p^ 

On  a 

lu    +  P-2  =P3  +P/.- 

Si  les  deux  événements  étaient  incompatibles,  on  aurait 
dans  cette  formule  p^  =  0,  c'est-à-dire  le  théorème  de  la 
probabilité  totale;  mais  je  suppose  qu'il  n'en  soit  pas  ainsi. 

Le  gain  à  réaliser  est  de  1  franc  si  A  se  produit  ;  de  1  franc 
également  si  B  se  produit. 

L'espérance  mathématique  totale  en  tenant  compte  des 
deux  événements  sera  p^  -\-  Pj- 

Ainsi,  que  les   événements    soient   compatibles    ou  non, 
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lespérance  matliématique  totale  est  la  somme  des  espé- 
rances inalhématiques  partielles. 

Si  les  deux  événements  se  produisaient,  le  joueur  tou- 
cherait 2  francs. 

Cas  plus  compliqué:  Uu  certain  nombre  d'événements  A,, 
Aj,  ...  A^  sont  possibles  :  la  probabilité  pour  que  A,  se  pro- 
duise est  Pi,  la  probabilité  pour  que  A,-  et  A;;,  se  produisent 
à  la  fois  est  pn-,  la  probabilité  pour  que  A,,  \j  et  A/,  se  pro- 
duisent à  la  fois  est  pij/,. 

On  promet  à  un  joueur  de  lui  payer  1  franc  pour  chaque 
événement  qui  se  produit  ;  s'il  y  en  a  /«,  il  touchera  n  francs. 
Son  espérance  mathématique  totale  est  la  somme  de  celles 
que  lui  assure  chacun  des  événements,  c'est-à-dire  Sp,-. 

On  lui  promet  autant  de  francs  qu'il  y  aura  de  combinai- 
sons de  deux  événements  pris  dans  la  série.  Si  deux  événe- 
ments se  produisent,  il  touche  1  franc;  si  trois  événements 
A,  B,  C  se  produisent,  il  touche  3   francs,    car  il  y  a  trois 

combinaisons  AB,  BC,  CA  ;  si  7i  événements  se  produisent, 

.  a  (n  —  1) 

11  touche  -^ iraiics. 

Quand  deux  événements  x\,  et  A^.  se  produisent,  cette 
combinaison  lui  assurant  1  franc,  l'espérance  mathématique 
est  pi/,,  et  l'espérance  mathématique  totale  est  alors  : 

n  (n  —  1]  ^ 
-^ ^Pa- 

Si  n  événements  se  produisent,  et  qu'on  donne  au  joueur 

1  franc  par  groupe  de  3,  il  touchera  alors  '—- ' ~ 

et  son  espérance  mathématique  sera 

7)  'il  —  1     n  —  :i   ^^ 


d.^2  3 
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Jouons  maintenant  avec  les  conventions  suivantes  :  je 
paie  1  franc  par  événement  qui  se  produit  ;  le  joueur  me 
paie  1  franc  par  combinaison  de  deux  événements;  je  lui 
paie  1  franc  par  combinaison  de  trois  événements  ;  il  me 
paie    1  franc  par  combinaison  de  quatre  événements,  etc. 

Événements  :  1,  2,  3,  4,  ... 

Gain  du  joueur  :  1,       —  1,  1,       —  1,  ... 


Son  gain  est  : 


n  iyi  —  1)    ,    71  in  —  1)  (w  —  2) 

quand  il  y  a  n  événements  réalisés. 
Si  n  =  o,  (I  ^  o. 
On  a,  en  général  : 

,    n[n- — 1)  -    nin — l]fn  —  2)    ,  ,.       .n 

Donc,  pour  w  >■  o,  «i  ^  1. 

Ainsi,  quand  aucun  événement  ne  se  produit,  le  joueur 
ne  touche  rien  ;  quand  il  s'en  produit  n,  il  touche  toujours 
1  franc. 

Son  espérance  mathématique  est: 

D'où  une  généralisation  du  théorème  des  probabilités  to- 
tales :  la  probabilité  pour  que  l'un,  au  moins,  des  événe- 
ments se  produise  est  : 

5.  Application  au  problème  de  la  rencontre. 
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Dans  une  urne,  il  y  a  a  boules  numérotées  de  1  à  jj.;  je 
les  tire  les  unes  après  les  autres,  jusqu'à  ce  que  l'urne  soit 
vide.  II  y  a  rencontre  si,  au  i^  tirage,  je  tire  la  boule  numé- 
rotée i. 

Cherchons  la  probabilité  pour  qu'il  y  ait  au  moins  une 
rencontre. 

D'abord  la  probabilité  pour  qu'il  y  ait  rencontre  au  rang  i 

1  .  ,  . 

est  -  En  effet,  il  y  a  en  tout  autant  d  hypothèses  possibles 

V- 
que  de  permutations  de  [j.  lettres,  soit  u.  !  Combien  sont   fa- 
vorables? celles  où  la  /^  boule  est  au  rang  /;  je  puis  y  per- 
muter les  <x  —  1  autres,  donc  a  —  1  !   cas  favorables.  La 
probabilité  est  : 

a  —  l  !        1 
tx  !  [X 

Cherchons  la  probabilité  pour  qu'il  y  ait  rencontre  au  i" 
et  au  h'^  tirage.  Deux  boules  ont  un  rang  déterminé  :  si 
nous  permutons  les  a  —  2  autres,  nous  verrons  que  le 
nombre  des  cas  favorables  est  a  —  2  !  ;  la  probabilité  est  : 

1 

Vile 


IX.  (a  —  1) 

De  même  : 

1 

P'J/^  =  TT. TYTT— 


2) 


Toutes   les  Pi  sont  égales  ;  comme  il  peut  y  avoir  u.    ren- 
contres : 

S/5,  =  1. 

Pour  calculer  2p,A-,  remarquons  que  le  nombre  possible 
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a  (u.  —  1  ) 


des  doubles  rencontres  est 


i.i 


[i.l[X 


(fx  —  1 1  ^  1 


Pi/c   =   S^/t    = 


De  même 


-Dfp^  — 2) 


[i-^jx  —  ij  i[x 


;)/yi.    =    i]p,y/, 


1.2.3.  '  -^ '^'■"^       1.2.3 

Si  je  promets  à  un  joueur  autant  de  francs  que  de  ren- 
contres simples,  son  espérance  mathématique  sera  1  ;  elle 

1 

sera  ->  s  il  reçoit  1  franc  par  combinaison  de  2  rencontres  ; 

i  . 

->  s'il  reçoit  1  franc  par  combinaison  de  3  rencontres  ;  etc. 

Quelle  est  la  probabilité  pour  qu'il  y  ait  une  rencontre 
au  moins?  C'est  ce  que  nous  avons  appelé  tout  à  l'heure  P. 

1  !       2!  ^3!        ij.\ 

le  dernier  terme  correspond  au  cas  de  <j.  rencontres  simul- 
tanées. Les  termes  de  P  sont  les  <j.  premiers  termes  du  déve- 
loppement de  1  —  6"',  et  cette  série  converge  avec  une  rapi- 
dité extrême.  L'erreur  est  d'autant  plus  petite  que  [;.  est  plus 

1 

grand,  et,  pour  y.  =  20,  elle  est  inférieure  à  ^-- jj  c'est-k-dire 

insignifiante. 

La  probabilité  cherchée  est  1  —  e-  *. 

6.  On  promet  à  un  joueur  (toujours  sans  remettre  les 
boules  dans  l'urne)  de  lui  donner  un  franc  à  chaque  maxi- 
mum de  la  liste  que  l'on  obtient,  en  écrivant  les  numéros 
sortis  dans  leur  ordre  de  tirage.  Quelle  est  son  espérance 
mathématique? 
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Supposons  f[u'il  y  ait  luaxinnim  au  i"  tirage;  on  a  tiré 
trois  boules  «,  b,  c,  la  U  —  1)*,  la  i^  et  la  [i  -f-  1  %  et  puis- 
qu'il y  a  maximum,  a  <i  b  ^  c. 

Il  y  a  a!  cas  possibles.  Sans  toucher  aux  autres  boules,  je 
permute  entre  elles  a,  b,  c  ;  six  combinaisons  sont  pos- 
sibles, dont  deux  sont  favorables,  a,  />»,  c  et  e,  b,  a. 

Dans  ce  g-roupe,  la  probabilité  pour  un  maximum  est  dune 

1  a  ! 

-•  Or,  il  y  a^  de  ces  groupes,  correspondant  au  /"  liraye, 

o  u 

1 

mais,   pour  ce  tirage,   l'espérance   matliématique    est    • 

L'espérance  mathématique  totale  sera  la  somme  des  espé- 
rances mathématiques  partielles  ;  d'autre  part,  sauf  conven- 
tions spéciales  que  je  ne  suppose  pas,  ni  le  premier,  ni  le 
dernier  tirage  ne  peuvent  donner  lieu  à  paiement. 

u  —  2 
L'espérance  mathématique  totale  est  donc  ' — 
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1.  n  joueurs  ont  chacun  un  dé  et  mettent  chacun  1  franc 
comme  enjeu:  celui  qui  amènera  le  point  le  plus  fort  ramas- 
sera les  n  francs;  et  si  plusieurs  joueurs  obtiennent  le  môme 
point,  plus  fort  que  celui  de  tous  les  autres,  ils  se  partage- 
ront l'enjeu. 

Le  premier  joueur,  A,  amène  le  point  K  :  quelle  est,  à  ce 
moment,  son  espérance  mathématique? 

-La  probabilité  pour  qu'un  autre  joueur  déterminé  amène 

1  . 

le  point  K  est  -  ;  pour  qu'il  amène  un  point  plus  petit  que  K, 

K  — 1 

6 
Quelle  est  la  probabilité  pour  que  A  partage  l'enjeu  avec 

i  —  1  joueurs  déterminés?  Ces  / —  1  joueurs  doivent  amener 

le  point  K,  les  n  —  i  autres  un  point   inférieur   à    K.    La 

probabilité  cherchée  est  donc  une  probabilité   composée,  le 

produit  de  (-1       pai'  i 

Ainsi  la  probabilité  pour  que  A  partage  avec  i —  1  joueurs 

(K  —  1)"-' 
déterminés  est  ^ — 7^,731 0"  peut  former  autant  de  groupes 

de  /  —  1  joueurs  qu'il  y  a  de  combinaisons  de  n  —  1  lettres 

^  —  1  a  ^  —  1,  soit -; r,' 

i  —  1  !  n  —  il 


K  —  1\«- 
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Chacune  de  ces  combinaisons  donne  à  A  la  probabilité 
ci-dessus,  et  le  gain  correspondant  est  ";  l'espérance  ma- 
thématique de  A  est  : 


n_l!  (K  — 1"-'     /'  '^  '•        l 


K  —  1  "- 


Il  ,1  —  il  6"  -  '  i        i\  n  —  i 


^n-\ 


Il  faut  faire  la  somme  de  ces  espérances  mathématiques 
depuis  i  =  1  jusipi'à  i  =  n,  ce  dernier  cas  étant  celui  où 
l'enjeu  est  partagé  également  entre  tous. 

ZJ  i  !  H  -  i  !        0"-* 
C'est  le  développement  du  binôme 

6"  -  ' 

(K  —  1)« 
à  part  le  terme  qui  correspond  a  i  =  o,  soit  —  -~^, 


•.rt  -  1 


L'espérance  mathématique  totale  est  donc  : 

K"  —  (K  —  1)" 
0"-' 

2.  La  théorie  de  l'espérance  mathématique  a  donné  lieu  à 
un  paradoxe  célèbre,  le  paradoxe  de  Saint-Pétersbourg  : 
Paul  lance  une  pièce  de  .monnaie  ;  si  elle  retombe  pile,  il 
paiel  franc  à  Pierre  et  la  partie  est  terminée  ;  si  elle  retombe 
face,  on  recommence.  Si  au  deuxième  coup  on  amène  pile, 
Pierre  reçoit  -2  francs  et  la  partie  est  terminée  ;  si  on  amène 
face,  on  recommence.  Au  troisième  coup,  Pierre  recevra 
4  francs,  ou  bien  la  partie  continuera,  et  ainsi  de  suite.  Si  la 
pièce  présente  face  n  fois  de  suite  et  que  le  (n  -f  1]"  coup 
soit  pile,  Paul  paie  2"  francs. 
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Quelle  somme  doit  donner  Pierre  à  Paul  au  commence- 
ment de  la  partie  pour  que  le  jeu  soit  équitable  ?  En  d'autres 
termes,  quelle  est  l'espérance  mathématique  de  Pierre  ? 

.1 

La  probabilité  d'amener  pile  au  premier  coup  est  r  ;  l'es- 

i 

pérance  correspondante  est  -• 

La  probabilité  d'amener  face  au  premier  coup,  puis  pile 
au  second,   événements   indépendants,  est    une  probabilité 

i  .  1  i 

composée,  j.  —  L'espérance  mathématique  est  -  x  2  =r  -• 

11 

Au  troisième  coup,  cette  espérance  est  -  X  4  =  -• 

1  1 

Au  n«  coup,  ^;;-;^  X  2"  = -• 

l 

Tous  les  termes  de  la  série  sont  égaux  à  -  ;    l'espérance 

mathématique  de  Pierre  est  infinie  :   il  n'achèterait  jamais 
trop  cher  le  droit  de  jouer. 

On  a  voulu  expliquer  ce  paradoxe  de  plusieurs  manières. 
Paul  n'est  pas  infiniment  riche,  a-t-on  dit  :  sa  fortune  est 
comprise,  par  exemple,  entre  2''  et  2''  +  *  ;  si  Ton  amène 
pile  au  {p  -f-  ly  coup,  il  devra  2''  francs  et  pourra  payer  ; 
mais  si  l'on  amène  pile  au  coup  suivant,  il  devra  2''  +  '  francs, 
et  sera  insolvable.  Pierre  ne  peut  donc  toucher  que  2''  francs  ; 
son  espérance  mathématique  devient 


111  1  11 

-4--X2-I--X-4-I-      -1 — -—■x^lP-\-——'if-\-——'iP4- 


La  série  devient 


11  111, 

2  +  2~^  •••  "T~2'~4"'~8~'~ 
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p  -\-  i  termes  sont  égaux  à  -•  le   reste   a    pour   soinnie  -• 
l'espérance  mathématique  est  : 

p-\-  i  ,  i     ;H-_r 


Si  la  fortune  do  Paul  est,  par  exemple,  dun  milliard,  ou 

pourra  faire  p  =  30.  et  l'espérance  mathématique  de  Pierre 

3-2 
sera—  =:  IB.  On  voit  qu'elle  se  réduit  considérablement. 

On  a  dit  aussi  que  le  plaisir  de  gagner  1  000  francs  est 
plus  grand  pour  celui  qui  n'a  rien  que  pour  le  millionnaire  ; 
que  le  plaisir  de  doubler  sa  fortune  est  indépendant  de  cette 
fortune. 

Le  plaisir,  quand  on  possède  une  fortune  x.  de  gagner 
une  somme  A  sera  mesuré  par 

^        X 

On  a  remplacé  l'espérance  mathématicpe  par  l'espé- 
rance morale. 

Pu  étant  la  probabilité  de  réaliser  un   gain  h,  l'espérance 
morale  sera 

^       1        X  -{-  h 
^Pk  log 

^  X 

ou 


-  loff 1 \-  —  Ino-  ■ L    .    J loo-    ! 


pour  le  paradoxe  de  Saint-Pétersbourg. 
Cette  série  est  manifestement  conversfente. 

3.  Deux  joueurs,  dont  l'un,  A.  possède  m  francs,  et  l'autre, 
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B,  n  francs,  jouent  à  l  franc  la  partie  et  poursuivent  le  jeu 
jusqu'à  ce  que  l'un  des  deux  soit  ruiné.  La  probabilité 

pour  que  cet  événement  se  produise  sera  fonction  de  m  et  w, 
cp  (m,  n),  et  comme  la  somme  des  fortunes,  w  -|-  n  =  s,  est 
une  constante,  cp  sera  fonction  de  s  et  n,  c'est-à-dire  de  n. 
Appelons  cp  {n)  la  probabilité  pour  que  B  finisse  par  être 
ruiné  :  nous  supposerons  ici  que  les  conditions  ne  sont  pas 
équitables. 

Si  A  à  chaque  partie  a  la  probabilité  p  de  gagner,  B  a  la 
probabilité  1  —  p. 

On  joue  une  partie  nouvelle.  Deux  hypothèses  se  pré- 
sentent: A  va  gagner  et  B  aura  n  —  1  francs;  B  gagnera  et 
aura  n  -j-  i  francs. 

cp  {n)  comprendra  donc  la  probajjilité  pour  que  B  perde 
cette  partie  et  finisse  par  être  ruiné,  soit  p  cp  (n  —  1),  et  aussi 
la  probabilité  pour  que  B  gagne  cette  même  partie,  mais 
finisse  également  par  être  ruiné,   soit  (1  — p)  cp  (n  -j-  1). 

(1)        cp  {n)=p:f  (n  -  1)  -h  (l  -p)  cp  {n  +  1). 

Cette  relation  de  récurrence  servira  à  déterminer  cp  (n).  Il 
faut  en  outre  connaître  les  conditions  limites. 

Si  n  =  o,  B  serait  déjà  ruiné  ;  si  w  =:  s,  ni  =  o,  A  n'aurait 
rien.  Donc  cp  (0)  =  1,  cp  (s)  =  o. 

4.  Résolvons  Téquation  de  récurrence  plus  générale  : 

AKcp(n+K)^-AK-,cp(/i-f-K-lj-f -f-A^cp(«+lj+Aocp(H)  =  o, 

où  les  A  sont  des  coefficients  constants.  C'est  une  équation 
aux  différences  finies,  linéaire  et  à  coefficients  constants, 
dont  l'intégration  rappelle  celle  des  équations  différentielles 
linéaires  à  coefficients  constants. 
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Supposons  que  Ton  ait  trouvé  K  solutions  -i),  (/<),  a-al")'  •••i 
i-K  {>i),  Je  telle  sorte  que: 

S, A,»,-  (n  -j-  (?)  =  o. 

Nous  aurons  encore  une  solution  en  posant  : 

0)  bi]  =  a,î,,  (»i  -\-  7.2Œ.2  («)  +  •••  +  ^K'rK  f»)- 

En  clTet,  multiplions  le  X  précédent  par  7.,,  et  faisons  la 
somme  des  termes  obtenus  en  faisant  varier  i. 

S,a,SçA,,ç>,-  («  +  q)  =  i:,/A,/i:,a,Y/  ['l  -{- q)  =  O 

Si  cp,,  Çoi  î  îK  sont  linéairement  indépendants,  on  aura 

ainsi  la  solution  générale.  Supposons,   en  effet,  que  ce  ne 
soit  pas  la  solution  générale  ;  alors  : 

Je  vais  choisir  a^,  a,,  ...  ïk  de  façon  à  satisfaire  au  sys- 
tème suivant  : 

cp  (Oj  =  a,cp,  (0)  +  a^cpa  (0)  -f-  .. .  -f  aK'fK  (0) 

cp  (1)  =  a<9,  (1)  -f-  a.cp.  (1^,  -I-  ...  +  aKSK  (1, 

<p(K— i;.  =  a,cp,  (K— l)-]- a2cp2(K  — 1^4-  ...  4-aK=.K(K— 1) 

Ces  K  équations  linéaires  déterminent  a,,  a,,  ...,  aK,  à 
condition  que  leur  déterminant  soit  différent  de  zéro,  ce  qui 
aura  lieu  quand  s,,  So,  ...,  ok  seront  linéairement  indépen- 
dants. Dans  ce  cas,  on  aura  : 

,].  (0)  =  J;  (1)  =  ^  (2)  =  ...  =  'l    K  —1=0, 

et  par  suite  la  relation  suivante  : 

AK4'(n-f-K)  +  AK_i'H"  +  K-i;-f...+A,^(n-fl:+AoJ'(î2)=o. 
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Je  fais  il  :=  o,  tous  les  termes  s'annulent  sauf  Ak^  (K): 
donc  <\>  (K)  est  nul. 

Si  je  fais  n  =  i,  •]/  (K  -j-  1)  est  nul... 

Donc  <\>  {n)  est  identiquement  nul,  et  cp  [n]  se  réduit  à 
a|Cp,  -j-  (x^di.^  -\~  ...  -{-  KKCpK.  Ainsi,  il  suftit  de  connaître  K 
intégrales  particulières  linéairement  indépendantes  pour 
connaître  l'intégrale  générale. 

Pour  trouver  K  intégrales  linéairement  indépendantes,  je 
pose  cp  {n)  =  p".  Alors  : 

AKr-'''-f-AK-ifJ"^'^-'+  ...  +Aor  =  o 
ou 

AkP'^H- AK_i^'^-'  +  -"  +  Ao  =  o, 

d'où  K  valeurs  particulières  de  p,  et  par  suite  K  intégrales 
particulières. 

Il  se  présente  une  exception,  quand  l'équation  en  fi  offre 
des  racines  multiples,  par  exemple  une  racine  double, 
p^  :=  §2  5  ^'^  faisant  varier  les  coefficients  d'une  manière 
continue,  il  peut  arriver  que  deux  racines  deviennent  égales. 
On  n'a  plus  alors  K  solutions. 

k'i   J3« 

p'I  et  p  2  sont  des  solutions  ;  — ' r^  est  une  combinaison 

linéaire,  et  par  conséquent  une  solution.  Quand  p^  tend  vers 
li.2,  par  raison  de  continuité,  à  la  limite  on  a  encore  une 
solution.  Cette  limite  s'obtient  en  différentiant  par  rapport 

à  p^  les   deux  termes   du    rapport,    ce    qui    donne   — ^ —  ; 

n^"-^  ou,  si  l'on  veut,  wp'^  est  donc  une  nouvelle  solution. 
Avec  une  racine  triple,  on  aurait  en  outre  n^  pf ,  etc. 
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5.  Appliquons  colle  règle  au  problème  qui  nous  occupe, 
c'esl-à-dire  à  l'équalion  (1)  du  paragraphe  3. 
Faisons  cp  (w)  =  fJ",  il  viendra 

OU 

Celte  équation  du  second  degré  a  une  racine  évidente, 
P  ^  1  ;  l'autre  est  r—^ —  :  c'est  cette  valeur  que  nous  appel- 
lerons désormais  p.  Les  deux  solutions  ^"  et  1  donnent  pour 
la  valeur  générale  de  cp  (n)  : 

(p  (n)  =  rt8«  -f-  b. 

Les  conditions  limites  donnent  les  deux  constantes  arbi- 
traires. 

1  =  a-\-  b, 
0  =  cif,'  +  b  ; 


d'où 


et 


1  ,         —  8^ 

a  = r-.'       b  =  . '~, 


'l  —  8^- 


Cette  expression  devient  illusoire,  si  l'on  suppose  8  =  1. 

1 

Quand  ^  =  1,  p  =  -  ;  le  jeu  serait  équitable.  On  cherche 

la  vraie  valeur  de  cp  (n)  par  la  règle  de  l'Hôpital  : 
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Trois  cas  sont  à  considérer  : 

1"  13  >  1.  Le  jeu  est  avantageux  à  A,  p  >  1  — p, 

p  .s-  fJ  II 

2°  p  =  1.  Le  jeu  est  équitable,  p  =  1  —  p, 


s  —  w 

o    n)  = 


3°  8  <  1.  Le  jeu  est  avantageux  à  B,  p  <  1  —  p, 


La  probabilité  pour  que  B  se  ruine  est  '— 4 —  Pour  avoir 

la  probabilité  pour  que  A  se  ruine,  on  permute  p  et  1  —  p  ; 
P  se  change  en  —  et  n  en  m  : 


e-^- 

-  s-'" 

P-- 

—  1 

1  - 

-  8" 

c'est-à-dire  : 

1  —  8^- 

6.  La  somme  des  deux  probabilités 

9/  —  6"        1  —  8« 
^.-  _  1    +  YITf 

est  égale  à  l'unité,  ce  qui  n'était  pas  évident  a  priori.  En 
effet,  la  probabilité  pour  que  la  partie  se  prolonge  indéfini-' 
ment  pouvait  avoir  une  valeur  finie. 

Supposons  s  très  grand.  Quand  p  >  1,  (3*  est  très  grand 
et  cp  (n)  a  le  signe  de  8^;  sa  limite  est  \.  Quand  8  =  1,  sa 
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limite  est  encore  1.  Quand  p  <  1,  S'  tend  vers  0  à  mesure 
que  s  augmente,  et  la  limite  de  :p  (n)  est  P". 

Conclusion:  Si  donc  s  est  très  grand  et  n  fini,  on  a  la  cer- 
titude d'être  ruiné  dans  un  jeu  équitable  ou  avantageux  à 
l'adversaire.  Mais  si  le  jeu  est  avantageux  au  joueur,  la  pro- 
babilité d'être  ruiné  devient  d'autant  plus  petite  que  sa  for- 
tune est  plus  grande. 

Un  joueur  de  profession,  un  banquier,  joue  avec  tout  le 
monde,  c'est-à-dire  avec  un  adversaire  infiniment  riche, 
mais  le  jeu  lui  réserve  des,  avantages.  Au  contraire  le  punie 
qui  jouera  indéfiniment  est  sûr  d'être  ruiné. 

7.  M.  Bertrand  a  calculé  le  momen(  probable  de  sa  ruine. 

Pour  le  banquier,  p  <  1,  la  probabilité  pour  que  labanqie 

saute  est  P''.   8  est  le  rapport  des  chances  favorables   au 

ponte,    aux   chances    favorables    au    banquier;    supposons 

19  1 

6  =  -7777»  c'est-à-dire  8=1  —  ^  -  • 

20  '  20 

n  est  la  fortune  du  banquier,  ou  prenant  pour  unité  l'enjeu 
■de  chaque  partie  ;  il  y  a  un  maximum  pour  cet  enjeu,  d'où 
pour  n  un  certain  maximum  ;  soit  ?i  =  1  000. 

La  probabilité  pour  que  la  banque  saute  est  : 

/  i\)ooo         r/  i\20n:;o 

('-s)      =[('-S5)] 

ou,  à  peu  près,  e-'^^,  quelque  chose  d'extrêmement  faible. 

Nous  arrêterons  ici  l'étude  des  cas  qui  se  ramènent  à  de 
simples  problèmes  d'analyse  combinatoire. 


CALCn.    riES    PROBABILITÉS. 
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1.  Nous  abordons  maintenant  les  théories  qui  se  rap- 
portent à  la  formule  de  Stirling,  au  théorème  de  Bernouilli 
et  aux  probabilités  des  causes  déduites  d'épreuves  répétées. 

Supposons  que  les  deux  événements  A  et  B,  de  probabi- 
lités respectives  p  et  q^  soient  contradictoires.  A  chaque 
épreuve,  l'un  d'eux  se  produit  certainement,  et  ils  ne  peuvent 
se  produire  tous  deux  ;  alors 

p  +  (^  =  1, 

la  probabilité  totale  est  égale  à  la  certitude. 

On  répète  m  fois  l'épreuve  :  à  chaque  épreuve  l'un  des 
deux  événements  se  produit.  Ainsi,  avec  un  dé,  l'événement 
A  peut  être  l'arrivée  du  point  6  et  l'événement  B  celle  des 

autres  points  ;  p  =  -'  et  5-  =  -• 

A  se  produira  un  certain  nombre  de  fois  et  B  aussi.  On 
demande  la  probabilité  pour  que  A  se  produise  a  fois,  et  B 
m  —  a  fois. 

On  suppose  que  la  probabilité  reste  la  même  à  chaque 

épreuve.  Avec  le  dé,  la  probabilité  est  toujours  -  pour  amener 
le  point  6.  Au  contraire,  avec  un  jeu  de  32  cartes,  la  proba- 
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bilité  de  tirer  un  roi  est  -  ;i  la  première   épreuve  ;    elle  est 

n 

T77  OU  —  à  la  deuxième,  suivant  (lu'on  n'a  pas  amené  ou  qu'on 
oi        Si  * 

a  amené  un  roi  à  la  première. 

2.  Cherchons  d'abord  la  probabilité  pour  que  les  événe- 
ments se  succèdent  dans  un  ordre  déterminé. 

AABAABBAB ; 

les  probabilités  de  chacun  de  ces  événements  seront 

ppqppqqpq, 

et  la  probabilité  composée,  la  probabilité  pour  que  tous  ces 
événements  se  produisent  à  la  fois,  est 

p^q*. 

En  général,  la  probabilité  pour  qu'il  se  produise  dans  un 
ordre  déterminé  a  événements  A  et  m  —  x  événements  B  est 

Elle  est  indépendante  de  l'ordre  considéré. 

3.  Si  l'on  veut  <{ue  les  m  épreuves  donnent  dans  un  ordre 
quelconque  %  événements  A  et  m  —  a  événements  B,  en 
vertu  du  principe  de  la  probabilité  totale,  la  probabilité 
cherchée  sera  la  somme  d'autant  de  termes  égaux  à  p^q'"-^ 
qu'il  y  a  d'unités  dans  le  nombre  des  permutations  avec 
répétition  de  a  lettres  A  et  de  m  —  x  lettres  B  ;  ce  nombre 
est  : 

m  ! 

y.liu  —  a  ! 
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La  probabilité  pour  que  les  événements  se  succèdent  dans 
un  ordre  quelconque  est  : 

m  ! 
(Xi  m  —  a  !       ■' 

c'est  l'un  des  termes  du  développement  de  {p  -f"  q)"\ 

Si  je  fais  la  somme  de  tous  les  termes  que  je  puis  obtenir 
en  faisant  a  égal  à  0,  à  !,.••>  à  m,  j'obliens  : 

Zu^  =  {p  +  q)"'  =   1. 

La  somme  des  probabilités  de  tous  les  cas  possibles  doit 
être  égale  à  l'unité,  puisqu'il  est  certain  que  l'un  de  ces  cas 
possibles  se  produira,  et  un  seul. 

4.  Quelle  est  la  plus  grande  de  toutes  ces  probabilités  ? 

Je  vais  calculer  le  rapport  d'un  terme  au  précédent. 

}/?  ' 
„ : r>'^+\  f.m-a.-\ 

(L  -\-  \\  m  —  X  —  1  ! 
-'  '  "•  —  ^  '  _  j  m  —  a    p 


pq- 


-\-\\m  —  -i.  —  i\''  a  +  1      q 


De  même  en  changeant  tx  en  a  —  1 


m  —  a  -|-  1     p 


Pour  que  iiy.  soit  la  plus  grande  de  toutes  les  probabilités, 
il  faut  que 

Wa+1   <-  '*a  ^   ^^(x—i 

Donc  : 

^^^^  <  1        et        ^^  >  1, 

Uix  Wa  — < 
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c'est-à-dire  : 

7)1  —  %p                            m  —  Jîj-  1  P  ^  I 
— ; — r     <  1  et  —     ' —  -  >  1- 

a  -f  1  ^  'j.  q 

OU  : 

[m  —  X]  p  <  {%  -\-  1)  q  et  [m  —  a  -1-  1;  p  >  a</, 

mp  —  1-P  <  't-q  -\-  q         et         mp  —  ■xp  -\-  p  >  xq . 

Comme  : 

xp  +  a<7  =  a    /;  +  ry,  =  a, 
mp  <  x  -\-  q         et         mp  >  a  —  p. 

De  telle  façon  que  nous  arrivons  aux  inégalités 

mp  +  p  >  !x  >  mp  —  q. 

D"où  une  limite  supérieure  et  une  limite  inférieure  pour  a. 
La  différence  de  ces  deux  limites  esi  p  -\-  q  =  i\  ainsi  a  est 
compris  entre  deux  nombres,  généralement  fractionnaires, 
qui  diffèrent  d'une  unité,  et  comme  a  est  entier,  ces  deux 
limites  déterminent  -j.. 

Il  y  a  exception  quand  mp  -j-  p  est  entier  ;  alors  mp  —  q 
l'est  aussi.  On  pourrait  hésiter  pour  a  ;  deux  termes  consé- 
cutifs dans  le  développement  de    p  -\-  7  '"  sont  égaux  entre 

eux. 

a  ,1 

Si  m  est  très  grand,  le  rapport  —  est  compris  entre  P  +  ~ 

et  ))  —  —  '  donc  —  sera  voisin  de  p. 
m  m 

C'est  une  forme  d'établissement  du  théorème  de  Ber- 
nouilli. 

Si  je  choisis  a  de  façon  que  «a  soit  le  plus  grand  possible, 
le  rapport  du  nombre  des  événements  A  au  nombre  des  évé- 
nements B  sera  à  peu  près  celui  des  probabilités  p  ei  q. 
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5.  Quelle  est  la  probabilité  pour  que  a  s'éloigne  d'une 
quantité  donnée  h  de  mp  ?  Soit  : 

a  —  mp  =  h. 

J'appelle  h  l'écart  et  je  vais  cliercber  la  valeur  probable 
«de  la  valeur  absolue  de  cet  écart,  ainsi  que  la  valeur  pro- 
bable de  son  carré. 

Soit  p^  la  probabilité  pour  qu'une  certaine  quantité  a  soit 
égale  à  a^  ; 

Soit  P2  1^  probabilité  pour  qu'une  certaine  quantité  a  soit 
égale  à  a^  ; 

Soit  Pn  la  probabilité  pour  qu'une  certaine  quantité  a  soit 
égale  à  «„• 

La  valeur  probable  de  a  est,  par  définition, 

a^p^  +  «22^2  -\-  ...  -\-  a„p„, 

c'est  l'espérance  mathématique  d'un  joueur  à   qui  on  pro- 
mettrait une  somme  égale  à  a. 

La  valeur  probable  de  a-  n'est  nullement  égale  au  carré  de 
la  valeur  probable  de  a.  Par  définition,  la  valeur  probable 

de  a?'  est 

^a?p,, 

tandis  que  le  carré  de  la  valeur  probable  de  a  est 

Soit  h  la  valeur  probable  de  d^,  c  celle  de  a. 
b-c^  =  Y.pi  ^a^pi  -  [llaiPiW 
car  Hpi  =  1 . 
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Nous  transformerons  le  second  membre  à  l'aide  de  l'iden- 
tité de  Lagrange  : 

SX2.  vX'2  _  [SXX']2  =  i:  (XY'  —  YX')2. 

Nous  poserons 

X'  =  Ui  \lp'i, 


d'où 


et: 


XX'  =  ûiPi 
2X2  =  -Ip,, 

i:x'2  =  s«,2p., 

SXX'  =  i-a,p/. 


Par  conséquent 


i  —  c"-  =  Z  (\'ih  ak  \!pk  —  \pk  ai  \Jpi)- 
b  —  c^  =z  '^pip;,  [cik  —  a.:t'\ 

Pi  et  Pi-  sont  essentiellement  positifs  ;  donc  b  —  c^  est  supé- 
rieur à  zéro,  et  la  valeur  probable  du  carré  de  a  est  toujours 
plus  grande  que  le  carré  de  la  valeur  probable  de  «,  sauf 
quand  a^  =  ai. 

6.  Occupons-nous  maintenant  de  la  valeur  probable  de  h, 
de  la  valeur  probable  du  module  \  h  \  de  /i,  de  la  valeur 
probable  de  h^. 

Je  vais  considérer  la  valeur  probable  d'une  quantité  quel- 
conque M  ;  c'est 

SMwa.     , 

■      >/?' 

SMwa  =  -M  -j ^ T  p^f/'"-*  ; 


7.\  m  —  a 
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le  second  membre  est  un  polynôme  entier,  homogène  et  de 
degré  m  par  rapport  à  p  et  r/,  que  je  désigne  par  F  (p,  q). 
Cherchons  la  valeur  probable  de  Ma;  c'est 


SMa 


a  !  ni  —  al 


p^q' 


Nous  avons  passé  d'une  expression  à  l'autre  en  multipliant 
par  a  les  ternies  successifs  ;  en  différentiantp*(/"'-<^  par  rap- 
port à  p,  nous  aurions  eu  ap«-<  q'"--^  ■  la  valeur  probable  de 
Ma  est  donc  : 

pdF 
dp 

Les  nombres  p  et  q  ne  sont  pas  indépendants,  puisque 
leur  somme  est  1.  On  a  fait  la  différentiation  comme  s'ils 
l'étaient,  on  a  différentié  par  rapport  à  p  comme  si  q  était 
constant.  De  plus,  M  peut  dépendre  de  p  :  h  dépend  de  p. 
J'éviterai  cette  confusion  de  la  manière  suivante  : 
A  la  place  de  p  et  q  j'introduis  deux  variables  auxiliaires^ 
ce  et  y,  et  je  considère 


SM 


^aj,.«-a 

0.1  m  —  a  ! 


que  j'appelle  F  {œ,  y).  Si  M  dépend  de  p,  je  n'y  remplace  pas 
p  et  q  para;  et  y  ;  la  valeur  probable  de  M  est  bien  alors 
F  [p,  q),  et 


SMa  -r^ r  T.^U" 

0.1  m  —  a  !      "^ 


.1-  ^P 

est  bien  œ  -7— 

dx 


On  y  remplacera  x  et  y  par  jo  et  5-  après  la  différentiation. 
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7.  Appliquons  co  qui  précède  au  problème  qui  nous 
occupe. 

Soit  d'abord  M  =  1. 

t'  (^>  ^)  =  E  a!»!- a!  ""'y'"  ""  =  («'  +  yT  ; 

si  je  fais  ensuite  : 

il  vient  : 

F(/3,  î)  =  (p  +  r/j-  =  l, 

et  en  effet  la  valeur  probable  de  1  est  1. 

Pour  avoir  la  valeur  probable  de  a,  je  différentie  F  (a?,  y]  par 
rapport  à  x^  et  je  multiplie  par  x^  ce  qui  me  donne 
mx{x-\-y)"^-^  ;  puis  je  fais  x  =^  p,  y  =  q.  La  valeur  pro- 
bable de  a  est  mp. 

Pour  avoir  la  valeur  probable  de  a^,  je  différentie  le  terme 
mx  {x -\- y)'"^-^  par  rapport  à  x,  puis  je  multiplie  par  x;  ce 
qui  me  donne  d'abord 

m  [x  -j-  î/)'"  ■"  '  -\~  m  [m  —  i)  x  [x  -{-  ?/)'"  -^ 
puis  : 

mx  [x  -f-  y)'"~*  -f"  '^  (^^'^  —  1)  ^^  ("^  ~1~  y)"^~'- 

En  faisant  x  =  p  et  y  ^  q,  j'obtiens  pour  la  valeur  pro- 
bable de  x^  : 

77ip  -f-  ?n^/3^  —  rnp'^. 

Cherchons  maintenant  les  valeurs  probables  de  h  et  h^. 
La  valeur  probable  de  7i  sera  la  valeur  probable   de    a, 
moins  la  valeur  probable  de  rnp,  c'est-à-dire 

mp  —  7np  =  o. 
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La  valeur  probable  de  l'écart  est  donc  nulle. 
La  valeur  de  li^  est  : 

h^  =  x^  —  'impx  -\~  m^p'^  ; 

sa  valeur  probable  est  donc  : 

[mp  -f  m^p^  —  mp^)  —  'imp.mp  -}-  m^p^, 

ou  : 

mp  (1  —  p), 
c'est-à-dire  mpq. 

La  valeur  probable  du  carré  de  Ji  est  mpq. 

On  vérifiera  en  passant  qu'elle  est  eiïectivement  plus 
grande  que  le  carré  de  la  valeur  probable  de  7^,  qui  est 
nulle. 

8.  Passons  à  la  valeur  probable  du  module  de  h  ;  cher- 
chons d'abord  quelle  serait  l'espérance  mathématique  d'un 
joueur  à  qui  on  promettrait  une  somme  1  si  l'écart  était  posi- 
tif, et  0  s'il  était  négatif? 

S  «a  doit  se  borner  aux  termes  dont  l'écart  est  positif. 
Soit  wp  le  dernier  terme  de  S?«o(  pour  lequel  l'écart  est  posi- 
tif; on  a: 

p  >  mp,  et  fJ  —  1  <  mp, 

ett  l'espérance  mathématique  de  ce  joueur  serait  : 

yyi/  777, 

p'"  +  jr  -  '  </  + +  3;^^_^  vh"'  -  ^ 

c'est-à-dire  F  (p,  q)  en  posant  : 

F  [x,  y)  =  X"'  4-  j  x'"-'y  H- +     ,  J'j_p;  ^'Y"-  !^- 
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Si  l'on  supposait  maintenant  (ju'on  ait  promis  à  ce  joueur 

une  somme  a,   son  espérance  mathématique  sera  x  —•>  en 

faisant  a;  =p,  y  =  </  après  la  difîérentiation.  Enfin,  la  valeur 
probable  d'une  fonction  qui  est  égale  à  h  pour  A  >  o  et  à  o 
pour  h  <.  o  sera  donc  l'espérance  mathématique  de  ce  joueur 
à  qui  l'on  promet  a  —  mp  quand  y.  >  mp;  c'est  donc  : 

d¥  „ 

^  ~7~  —  "'Pr  . 


F  est  un  polynôme  homogène  et  de  degré  m  en  o;  et  y  ; 
donc  : 

L'espérance  mathématique  ci-dessus  devient  : 

dF            dF  (/F 

X  -r-  —  px PU  ~r'' 

dx       ^     dx       ^  ^  dy 

ou  : 

dF  dV 


en  faisant  x  =:  p,  y  =^  q^  après  différentiation.  On  a  d'abord  : 

/dF       dF\ 
"^"^KTx-^jY 
d'autre  part  : 


—  =  w^-«-<  +  m(w  — l)a;"'-î?/4- A-TT^ — rSa;?-'^;'"-? 

dx  ^  '  -^   '  '   3  !  ;/i  —  S  î  ' 

dF 

—-=  mx'"-*  -|-  m  [m  —  1)  x"'-'^y  -\-  

Il  entre  un  terme  de  plus  dans  la  somme  qui  représente 


60  CALCUL    DES    PROBABILITES 

^F.  1        .       ,  ,  c?F         clF      ^  .,       ^    ,      ^  , 

-r- ,  ce  dernier  terme  représente  -, -r-'  et  il  est  effal  a 

ax  *"  dx        dy  ® 

^\  m  —  ^\      •  x 

et  après  qu'on  y  a  fait  a?  =/>,?/=  (7,  il  devient  : 


p^q 


p  !  m  —  ^  !  ^    ^         p 

Pour   l'espérance   mathématique    de   notre    joueur,    nous 
avons  donc  : 

On  y  reconnaît  le  produit  par  p^,  du  terme  z^p,  le  dernier 
qui  corresponde  à  un  écart  positif. 

9.  On  promet  à  un  joueur  une  somme  égale  à  la  valeur 
absolue  de  l'écart  :  soit  E  son  espérance  mathématique,  en 
admettant  qu'il  ne  doive  être  payé  que  si  l'écart  est  positif, 
E'  en  admettant  qu'il  ne  doive  être  payé  que  s'il  est  négatif. 

La  valeur  probable  de  h  est  E  —  E'. 

La  valeur  probable  du  module  de  h  est  E  -|-  E'. 

Comme  la  valeur  probable  de  h  est  nulle  : 

E  —  E'  =  o, 

et  la  valeur  probable  de  [  h  \  est  2E. 

10.  Ainsi  la  valeur  probable  de  l'écart  h  considéré  en 
valeur  relative  est  zéro  ;  la  valeur  probable  de  1t?  est  mpq  ; 
celle  de  I  /i  I    est  2E  ou 

28^         ^'         pP^'"-  P. 


m 
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S    correspond    au  dcinior   terme  pour  lequel  l'écart  est 
positif,  et  il  difTère  peu  de  mp. 

A  cette  expression  on  peut  sidjstituer  la  valeur  approchée 


^'^'"'J^lm-^l^'^'^'"'^' 


Ce  terme  est  beaucoup  plus  grand  que  tous  les  autres, 
mais  il  est  très  petit. 

La  valeur  probable  de  \  h  \  est  beaucoup  plus  petite  que 
vipq.  Suivant  une  remarque  déjà  faite,  le  carré  de  la  valeur 
probable  de  \  h  \  est  plus  petit  que  la  valeur  probable  de 
A-  :  donc  la  valeur  probable  de  \  h  \  est  certainement  plus 
petite  que  sjmpq. 
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1.  Je  vais  montrer  comment  on  peut  connaître  une  valeur 
approchée  de  ««,  du  terme  maximum,  de  la  valeur  probable 
de  I  A  I  ,  etc. 

Le  calcul  de  ces  valeurs  approchées  se  rattache  à  la  for- 
mule de  Stirling. 

On  a  : 


:  =  r  x"e-"dx  =  r  (n  -f-  1), 


c'est-à-dire  la  fonction  eulérienne;  cette  intégrale  conserve 
un  sens  quand  n  est  positif,  mais  non  entier.  Si  l'on  pose 

r  (w  -f-  1)  =  n"e-"  v'^TT», 

le  rapport  du  premier  membre  au  second  tend  vers  l'unité 
quand  n  augmente  indéfiniment. 

Je  ne  donnerai  pas  la  démonstration  générale,  mais  seule- 
ment pour  n  entier. 

La  formule  de  Stirling  sert  à  calculer  la  factorielle  d'un 
nombre  entier 


n  !  =:  n"e~"- 


\]l-Kn^ 


c'est  une  formule  asymptotique.   L'erreur  absolue  que  l'on 
commet  en  prenant  le  second  membre  comme  valeur  du  pre- 
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mier  augmente  indt-rmiinciil  avec  »,  mais  l'erreur  relative 
tend  vers  zéro. 

Il  en  résulte  que  l'erreur  absolue  sur  le  logarithme  de  n\ 
tend  vers  zéro. 

Je  puis  d'abord  écrire  : 

n\  =  n"e-'*  sjn  F  («) 

et  je  vais  dénionlrer  que  F  [ii)  tend  vers  une  limite  finie  et 
déterminée  C  quand  n  augmente  indéfiniment;  de  telle  sorte 
que  l'on  aura  alors  : 

7i\  =  Cn"e-"  \/n. 

2.  Considérons  le  produit 

F  (2)  F  (3)       F(n  4-  1) 
F  (1)  F  (2)  '"       F  (n) 

Ce  produit  infini  est  convergent,  ou,  ce  qui  revient  au 
même,  la  série,  dont  le  terme  général  est  : 


^        F  (n) 


est  convergente. 
Nous  avons 


{71  -f  11!  =  (n-f-  1)"+'  e-(«^i)  ^,i  ^  1  F    n  -{-  l] 

F    n  -\-  Il  _  n  4-  ^  •  »"e-"  \  n 

Fin)      "~       7i\       (n  -j-  iji  +  ie-'"  +  ^^  \n  -f  1 

_       ^  +  ^  n     4  /ZZT 

,      ,  1 


•'•^fr  =  '-KI)K'  +  .-) 
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Le  second  membre  se  transforme  à  l'aide  du  développe- 
ment de  L  (i  -}-  ^)  en  série  : 

V^    >    ^.)  U' ~"  9^2  +  ôTâ  ~"  ■"  ) 


ou: 


1  l 


2>i       3n2 


_1  +  _L_ 


c'est-à-dire 


1  c),,2  T^ 


12^2 

Si  j'appelle  m,j  le  premier  terme  de  cette  dernière  série 

—      _L 


€t: 


limite  nhc^  =  —  r^' 

En  vertu  d'une  règle  de  Gauss,  cette  série  est  convergente. 

3.  Reste  à  calculer  la  valeur  de  C. 
Rappelons  la  formule  de  Wallis  : 

TT       2  2  4  4  2«  2n 


2       1335       2w—  12^+1       ' 
on  en  déduit,  pour  n  plus  grand  que  toute  quantité  donnée: 

2.4  ...  2n 


\/ï= 


2       1.3  ...  (2n  —  1)  \j2n  +  1 
Au  numérateur  figurent  les  n  premiers  nombres  pairs,  au 
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dénominateur  les  n  premiers  nombres  impairs  ;  je  multiplie 
haut  et  bas  par  2.4  ...  2w, 

(2.4  ...  2»)^   _      2^"  (n ! ;^ 
2w  !  V2n  +  i  ~  2w  !  V2n~+1 

Cette  fraction  a  pour  limite  v/ ^  quand  n  augmente  indé- 
finiment. Si  nous  y  remplaçons  les  factorielles  par  leur 
valeur  approchée  pour  n  très  grand,  elle  devient  : 

2^"n^"e-'^"  C^n 


ou 


V  2w 


(2w  -f  1)' 


,  .    .  C 

et,  quand  w  grandit  indéfiniment,  elle  se  réduit  a  -^- 


Wî' 


Cette  limite  étant  la  même  que  la  précédente,  y  ■^■>  on  a  : 

C  =  \/^.. 

4.  Quand  deux  événements  contraires,  A  et  B,  ont  pour 
probabilité  respective  p  et  ry,  de  telle  sorte  que  p^q  =  \, 
nous  avons  vu  que,  sur  m  événements,  la  probabilité  pour 
qu'il  s'en  produise  a  égaux  à  A  et  m  —  a  égaux  à  B,  est  : 


m 


(X  !  m  —  a  ! 


I 


Calculons  une  valeur  approchée  de  u»,  en  supposant  m 
très  grand,  et  de  plus 
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OÙ  : 

2lv^  <  1. 

mp 
X  \Jm  est  très  grand  quand  m  est  très  grand,  mais  nous 
supposerons  X  fini  et  par  conséquent  l'erreur  relative  très 

petite,  quand  on  prend  mp  pour  valeur  de  a,  c'est-à-dire  — 


voisin 

del. 

oc 

mp  ~~ 

1  + 

p\Ji 

'n 

On 

a  comme 

conséquence 

• 

m  —  a  = 

mq 

—  À 

\m. 

puisque  : 

p-\-q  =  i. 

Je  remplace  dans  w»  chaque  factorielle  par  sa  valeur  cal- 
culée à  l'aide  de  la  formule  de  Stirling. 


m 


niQ-m  y/^Tt^i  p^r/'"-" 


a'='c-«  \/27ra.  [m  —  a)'«-«e-('«-a'  ^2::  [m  —  a) 

_     m"'p^q"^-'^        I  m 

^*  "  oc* (m  —  a)'"-«  V  27ra(m  —  a)* 

En  réunissant  les  termes  qui  ont  pour  exposant  a  et  ceux 
qui  ont  pour  exposant  m  —  a. 


\  a  y     \m  —  a/  y    27ra 


[m  —  oc) 
Or: 


a  [m  —  a)        [mp  -\-  \  \Jm)  [mq  —  1  \jt 
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—  tend  vers  l'unité  ainsi  que  ;  le  radical  qui  entre 

nip  ^         mq  ^ 

dans  ?<a  a  pour  limite. 


s^>. 


m 


"iTzmp.mq  sl-nmpq 

Nous  pouvons  écrire  : 

1 

LiUg.  =  L    /- —  aL  —  (7n  —  ai  L 


\2i:mpq  7np  mq 

ou  : 

1  —        /  X    \ 

Lxg,  =  L    !  —  (mp  +  X  \'m)  L  (  1  -f-  — ^  I 

—  {mq  —  X  \Jm)  L  (  1  —  -  -7-  ) . 
V         q  s'm/ 

Pour  m  très  grand,  nous  pouvons  développer  les  loga- 

À  X 

rithmes  de  1  +       /—  et  de   1  —       r=  par  la  formule  qui 
p  \m  q  s/m  ' 

donne  le  développement  de  L  '1  -{-00). 
Ainsi, 

dnp  +  X  \/m)  L  (l  -f-  — ^  ) 
'       \      *   p  s/m/ 

=  {mp  -\-  X  \/m)  (       ~  —  --^—  4-  .7~. r=  —  *••  ) 

Je  cherche  en  ce  moment  une  valeur  asymptotique  de  ??a, 
c'est-à-dire  une  valeur  telle  que  le  rapport  de  m»  à  cette  valeur 
tende  vers  1  quand  m  augmente  indéfiniment;  je  pourrai 
donc,  dans  le  produit  précédent,  négliger  tous  les  termes 

qui  tendent  vers  0,  ceux  qui  contiennent  m  ou  \fm  au  déno- 
minateur. 
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Il  restera  : 

A  ym  —  - — h  ~'         ou  ^  V^  +  ^' 

2p    '    p  2p 

J'en  déduirai  la  valeur  du  produit  : 


(^ry  -  X  \/m)  L  (l  -  ^  ^-) 


en  changeant  dans  le  résultat  précédent  X  en  —  X  et  p  en  ^7  ; 
et  la  somme  de  ces  produits  sera,  en  définitive  : 

ou  : 

—  I  -  4- -  h         c  est-a-dire         :; — 

2   \p        qf  2pq 

Ainsi  : 

T  T  ^  À2 

sj'i^rnpq       ^Vq 

En   repassant   des   logarithmes    aux    nombres,    on   aura 
comme  valeur  approchée  de  Ug,  : 

e    -P'i 


sJ'i-Kmpq 

Lorsque  )n  croît  indéfiniment,  le  rapport  de  ?<«  à  l'expres- 
sion précédente  tend  vers  l'unité. 

5.  J'observe  d'abord  ce  qui  se  passe  pour  le  terme  maxi- 
mum. 

Le  maximum  de  te»  s'obtient  en  donnant  à  a  une  valeur 
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qui  diffère  très  peu  de  mp\  alors  X  est  nul,  et  la  valeur  du 

1 

terme  maximum  est   /. 

\J-li:mpq 

Cette  expression  diminue  avec  m.  11  ne  faut  pas  croire 
que,  si  m  augmente  indéliniment,  la  probabilité  attendue 
s'approche  de  la  certitude;  au  contraire,  elle  tend  vers  zéro. 

C'est  là  le  théorème  de  Bernotdlli,  que  nous  préciserons 
tout  à  l'heure. 

6.  Quelle  est  la  probabilité  pour  que  X  soit  compris  entre 
X  et  Â  4-  dl? 

Je  considère  dl  comme  très  petit;  (Ca  \m  est  cependant  un 

A- 

nombre  entier,  ce  qui  veut  dire  que  cD.  est  de  l'ordre  de  ^;-- 
Si  je  donne  à  X  un  accroissement  très  petit,  l'exponentielle 

ne  changera  pas,  m»  sera  sensiblement  constant. 

La  probabilité  cherchée  est  une  somme  de  termes  tels  que 

a  varie  de  (x  à  a  +  ^,  a  et  x  +  A  étant  définis  par  : 

t  =  mp  -{-  X  \/H, 
a-\-  k  =  mp  +  fX  +  cD.)  \Jm, 


c'est-à-dire  : 


k  =  cCa  s! m. 


a  doit  être  compris  entre  les  limites  : 

a  —  mp 

X  +  cVk  ^  — r^  >  X 

c'est-à-dire  qu'il  doit  être  égal  à  l'un  des  nombres 
a  +  1,  =c  +  ^2,      ...,      a  +  A. 
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La  probabilité  totale  est  : 

U(x+f  -\-  Wa  +  2  -\-  ...  -j-  Ma+  k- 

Il  y  a  A  termes  sensiblement  égaux  a  u^;  la  probabilité 
cherchée  est  : 

ke    2m 


ou,  en  remplaçant  A  par  dl  \m^ 


dXe' 

,2l. 

•2pq 

sj^ 

m 

7. 

Nous  sommes  donc  ramenés  à 

considérer, 

en 

posant  : 

- 

h?  = 

1 

2pg 

'expression 

suivante  : 

hdxe- 

-  A2x2 

Elle  représente  la  probabilité  pour  qu'une  quantité  x  soit 
comprise  entre  x  ei  x  -\-  dx  \  pour  qu'elle  soit  comprise  entre 
^Q  et  x^ ,  la  probabilité  deviendra  : 


-•a-, 

hdxe  -  ''^^- 


pour  qu'elle  varie  de  —  oc  à  -|-  oc 


»+oc 

hdxer2_^' 
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En  posant  hx  =  y,  celte  dernière  intégrale  se  transforme 
en  : 

C'est  une  intégrale  connue,  dont  la  valeur  est  1. 

8.  Arrêtons-nous  sur  quelques  conséquences  de  ce  calcul. 

La  probabilité  pour  que  l  soit  compris  entre  —  oj  et 
-\-  X  est  1,  ce  qui  paraît  une  tautologie.  Cette  conclusion 
n'était  pas  si  sûre:  la  formule  dont  nous  nous  sommes  servis 
était  approchée,  et  vraie  seulement  si  X  est  petit  par  rapport 

à  y/m» 

Soit  d'abord  : 

a  =  772p  -\-  A  \m, 

la  probabilité  pour  que  À  soit  compris  entre  À^  et  À,  tendra, 
d'après  ce  qui  précède,  vers  : 


quand  m  croîtra  indéfiniment.  D'autre  part,  quand  À^  et  'k^ 
augmentent  indéfiniment,  l'intégrale  tend  vers  l'unité. 

Posons  maintenant 

a  >  mp  (1  —  e), 
et  - 

a  <  mp  (1  -|-  e). 

Soit  F  (s,  m)  la  probabilité  pour  qu'il  en  soit  ainsi.  Je  dis 
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que  je  puis  prendre  m  assez  grand,  t  étant  donné,  pour  que 
la  différence 

1  —  F  (e,  m), 

soit   plus    petite    qu'une   quantité   donnée    yj.     Choisissons 
d'abord  un  nombre  A  assez  grand  pour  que 

1  —  /        -=  e    ^P<1 

soit  plus  petite  que  ^-  Cela  est  possible  puisque  l'intégrale 

tend  vers  1  quand  X  augmente  indéfiniment.  Une  fois  X  choisi, 
je  prendrai  m  assez  grand  : 
i''  Pour  que 

X  <  ep  ym, 
d'où: 

X 


F  (e,  m)  >  F  ("-4= 

\p  \m 

2°  Pour  que  la  différence  : 


?  m     5 


_3i 


).  v^-i^pfy 


<1; 


cela  est  possible,  car,  pour  X  donné,  la  limite  de  la  proba- 
bilité 


est  représentée  par  l'intégrale  / 


pour  m  =  <xi 

+  x 
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On  aura  alors  : 

1  —  F  (e,  m)  <  71. 

En  résumé  : 

La  probabilité  pour  que  a  soit  compris  entre  mp 
(1  —  e)  et  nip  (1  -|-  SI,  quelque  petit  que  soit  s,  tend 
vers  l'unité  quand  m  augmente  indéfiniment. 

9.  On  peut  se  demander  quelle  est  la  valeur  probable  de 
x"  ;  ce  sera  par  définition 

/  hx'^dx       ,.,  „ 


OC         V 


r. 


Si  n  est  impair,  cette  intégrale  est  nulle. 
Si  n  est  pair,  elle  vaut  : 


,^  /      hx"dx        .,  „ 


0         V^r 

Nous  avons  cherché  la  valeur  probable  de  l'écart  en  valeur 
absolue  ;  cherchons  la  valeur  probable  de  la  valeur  absolue 
de  x'\  \  x'-  \  .  C'est 


A  I  a;"  1  dx 


■  /l2x2 


La  fonction  sous  le  signe  /  est  paire  ;  cette  intégrale  vaut 


donc 


2   /        '-r^e-/r..^ 


0 

10.  Ainsi,  dans  tous  les  cas,  nous  sommes  ramenés  à  cette 
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intégrale,    qui    se   ramène  elle-même  aux   intégrales  eulé- 
riennes. 
Posons 

h^x^  =  y, 
d'où  : 

_i 

'2  " 


hdx  —  xy     ^  dy. 


L'intég-rale  ci-dessus  devient 


)   /      1  dy  y     '-^  ; 


1      n 


ou  : 

n  -  1 


"?/  y  ^    ^ 


C'est  l'intégrale  eulérienne  : 

Si  n  est  pair  et  égal  à  2[j.  : 

et  comme  : 

a  valeur  probable  de    |  a?  '  |    est  : 

\_  i.3...(3;/.  — 1) 
A"  2!^ 
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Si  n  est  impair  et  égal  à  2a  +1,    la  valeur  probable  de 
I  X"  I  est  : 

ou  : 

-El-. 


Faisons  n  =  o,  la  valeur  probable  de  ]  1  |  est  égale  à  1. 

1 

Faisons  n  =  2,  la  valeur  probable  de  |  œ'^  |    est  — -^• 

Nous  avons   cberché  la  valeur  probable  de  (a  —  irip)'^  et 
nous  avons  trouvé  mpq.  Ici  nous  cherchons  la  valeur  probable 

de  X^,  c'est-à-dire  du  carré  de r=^'  ce  doit  être  pq. 

\m 

Cela  se  vérifie  sans  peine,  puisque  : 

1 

La  valeur  probable  de  |  a;  |    est —' 

h  Vît 
Nous  avons  cherché  la   valeur  probable  de    |  a  —  mp  \    ; 

c'est  le  produit  par  2mp</  du  terme  maximum  de  ÏWa,  ^mpqua., 

où  a  diffère  très  peu  de  mp. 

Pour  calculer  ce  terme  maximum  il  suffit  de  faire  À  =  o, 

on  trouve 


\I^-Km2jq 

Donc  la  valeur  probable  de   |  x  —  mp  \  est         ^      ,  c'est-à- 
sJ'^Tzmpq 

j .       \l^mpq 
dire  -î^ — —■• 

On  en  déduira  la  valeur  probable  de  X  en  divisant  par  \lm  ; 
on  trouve  : 

h\l% 
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1.  Nous  avons  posé 

a  =  mp  -j-  X  \lm^ 

et  nous  avons  cherché  la  probabilité  pour  que  X  soit  compris 
entre  deux  limites  X^  et  >^  ;  cette  probabilité  est  représentée 
pour  m  très  g'rand  par  l'intégrale  suivante  : 


^      e    2m  ^X. 


Nous  avons  été  conduits  ainsi  à  rechercher  ce  qui  se  passe 
lorsque  la  probabilité,  pour  que  x  soit  compris  entre  .x^  et  x^ , 
est  représentée  par  l'intégrale 

Je  dirai,  pour  abréger,  que  la  loi  de  probabilité  est  nor- 
male^ lorsque  la  valeur  de  la  probabilité  est  représentée  par 
cette  intégrale. 

Je  suppose  que  x  soit  positif;  la  probabilité  devient  : 

1 

c'est-à-dire  ;;• 
2 
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Si  je  considère  : 


Q—h-ix-i  clx, 


celte  intégrale  ira  constamment  en  croissant  quand  a;„ 
augmente  de  o  à  -f  x  ,  puisque  tous  ses  éléments  sont  posi- 
tifs. Klle  atteint   en  particulier  la  valeur  -• 

1 

La  quantité  x^  pour  la({uelle  elle  est  égale  a  -  est  ce  qu  on 

appelle  l'écart  probable.  La  probabilité  est  la  même  pour 
que  I  a;  I  atteigne  ou  n'atteigne  pas  cette  valeur. 

Xq  est  proportionnel  à  -  •  et  les  tables  calculées  pour  cette 

intégrale  permettent  d'en  trouver  la  valeur. 

Soit  X  une  quantité  dont  la  loi  de  probabilité  est  normale. 

1 

La  valeur  probable  de  x  est  — p- 

1 

La  valeur  probable  de  x-  est  ^r^- 

La  loi  de  probabilité  de  'xx  est  encore  normale. 
Posons  a.r  =  x'  ;  la  loi  de  probabilité  de  x'  est: 


— ^  e        ^  dx  . 


et  il  suffit  de  poser  h'  —  -• 

La  valeur  probable  du  carré  de  a.t;  est  —^^ 

2.  Supposons  que  la  probabilité  pour  que  x  soit  comprise 
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entre  aj^  et  x^  est  exprimée  par  l'intégrale  : 

I      -j=  e-  ''^^•■-'  dx, 

et  que  la  probabilité  pour  que  y  soit  comprise  entre  î/,,  et  y^ 
est  exprimée  par  l'intégrale: 

Supposons  en  outre  que  ces  deux  quantités  sont  indépen- 
dantes, ce  qui  peut  se  traduire  par  les  termes  suivants:  la 
probabilité  pour  que  la  première  soit  comprise  entre  x^  et 
x^  est  indépendante  de  la  probabilité  pour  que  la  seconde 
soit  comprise  entre  y^  et  y,. 

1  1 

La  valeur  probable  de  x~  est  tctt.^  celle  de  v^  ——• 

Quelle  est  la  probabilité  pour  que  le  point,  dont  les  coor- 
données seraient  x  et  y,  soit  compris  à  l'intérieur  d'une  aire 
donnée  ? 

Occupons-nous  d'abord  d'une  aire  rectangulaire. 

La  probabilité  pour  que  le  point  xy  tombe  à  l'intérieur  du 
rectangle,  c'est-à-dire  pour  que  les  deux  systèmes  d'inéga- 
lités 

â/i\    <^   CO   *\   OC I 

y(s<y  <yK 

soient  satisfaits  à  la  fois,  est  représentée  par  la  double  inté- 
grale suivante,  étendue  à  tout  le  rectangle  : 


—  e-Wx2-A'2y2  fXxdy. 
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Si  l'aire  est  quelconque,  je  la  découpe  en  rectangles  infi- 
niment petits.  La  probabilité  totale  sera  la  somme  des  inté- 
grales doubles  relatives  à  ces  rectangles  élémentaires,  ce 
sera  en  définitive  l'intégrale  double  étendue  à  tous  les  élé- 
ments de  l'aire. 

3.  Supposons  maintenant  que  Ton  ait  : 
x-{-y  =  z. 

La  probabilité  pour  que  z  soit  compris  entre  ^^  et  z  -f-  dz 
est  celle  pour  que  le  point  y 

[x,  y)  soit  compris  entre 
deux  droites  parallèles  infi- 
niment voisines  ;  la  proba- 
bilité cherchée  sera  celle 
qui  est  relative  à  cette  aire 
infiniment  petite. 

Je  vais  décomposer  cette 
aire  infiniment  petite  en  élé- 
ments. 


Fk;.   1. 


Pour  cela  je  partage  l'axe  des  x  en  une  infinité  d'éléments, 
et  par  les  points  de  division  je  mène  des  parallèles  à  l'axe  des 
j)  y  ;  j'obtiens  ainsi  une  infinité   de  petits  parallé- 

logrammes :  quelle  est  l'aire  de  l'un  d'eux,  ABCD  r* 
Les  points  A  et  B  sont  sur  la  droite 


FiG.  2 


x-^y  =  z\ 


les  coordonnées  de  A  sont  x  ei  z  —  x,  celles  de  B,  a;  -]-  dx 
ei  z  —  X  —  dx. 
Les  points  C  et  D  sont  sur  la  droite  : 

X  -\-  y  ~  z  -\-  dz\ 


80  CALCUL    DES    PROBABILITES 

les  coordonnées  de  D  sont  x  et  z  -\-  dz  —  x\  celles  de  C 

X  -f-  dx,       et       z  -\-  dz  —  x  —  dx. 

L'aire  du  parallélogramme  est  dxdz. 
L'intégrale  double  sera  la  somme  des  éléments  relatifs  à 
chaque  parallélogramme  : 

dxdz —  Q-mx'i—Ki{z-xyi.^ 

71 

Dans  une  première  intégration  : 

y  qX.  z  doivent  être  regardées  comme  constantes  et  x  varie 
de  —  00  à  -}-  00  . 
L'intégrale  est  donc  : 

■hv  /.+ao 
dz—\        e-'^^^''-'^n-^-x)-^dx. 

Posons  : 

P  =  h^x^  +  h'-^  {x  —  z)\ 
c'est-à-dire  : 

P   =  (/l2   _|_  h'-i^  ^2   _  2//2^^  -p  h'^z-\ 

ou  : 

P  =  (ax  —  hf  -f-  c 


en  posa 

nt  : 

a 

— 

\]h^ 

+  h'\ 

h 

h'^z 
a 

1 

c  = 

h' 

2^2  _ 

-b^. 

Nous 

avons 

à 

évaluer 

I 


e— p  dx 
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OU  : 

ÇQ-{ax-b)-i-c  clx. 

Posons  : 

ax  —  b  =  \\ 

celte  intégrale  est  : 


/  a 


et  comme  a;  ou  ;  varie  de  —  x  à  -}-  x  , 

a 

La  probabilité  cherchée,  pour  que  s  soit  compris  entre  z 
et  ^  +  clz^  est  donc  : 

,     hh'  (?-'■ 

dz • 

7c     a 

On  a  d'autre  part  : 


c  =  h'^z-' 


h'  -\-  h'-       A2  -\-  h'-i 
La  pi-obabilité  en  question  est  donc  : 

,     hh' e    ''i^  +  t<^^ 

dz :• 

La  loi  de  probabilité  est  normale. 

La  valeur  probable  de  z-  ou  de  (^-f~  yf  sera  : 

1  1  1    . 
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c'est-à-dire  que  la  valeur  probable  de  [x  -f-  yf  est  la  somme 
de  la  valeur  probable  de  x-  et  de  la  valeur  probable  de  y"^. 

La  valeur  probable  de  'ixy  est  en  effet  nulle  ici,  et  nous 
nous  ne  l'aurions  pas  su  a  priori,  si  la  loi  de  probabilité 
n'avait  pas  été  normale. 

Cette  élégante  démonstration  est  due  à  M.  d'Ocagne. 

4.  Problème  des  épreuves  répétées.  —  Deux  événe- 
ments contraires,  A  et  B,  ont  pour  probabilité  respective 
p  et  q.  Ainsi  une  urne  contient  a  boules  blancbes  et  v  boules 
noires, 


p  = 


-f-    V  [^   + 


on  en  tire  un  très  grand  nombre  de  boules  m,   en  remet- 
tant chaque  fois  la  Ijoule  sortie  dans  l'urne.  Si  l'on  a  tiré  a 
boules  blanches,  il  y  a  beaucoup  de  chances,  d'après  le  théo- 
rème de  Bernouilli,  que  —  diffère  peu  de  l'unité. 
^      mp 

La  valeur  probable  de  X^  sera  égale  à  pq. 

Changeons  un  peu  les  conditions,  de  manière  que  le 
hasard  ne  préside  plus  seul  à  la  distribution  des  coups.  Con- 
sidérons deux  urnes,  la  première  renfermant  [x  boules 
blanches  et  v  noires,  la  seconde  u.'  blanches  et  v'  noires,  et 
convenons  de  tirer  alternativement  dans  l'une  et  dans 
l'autre. 

Après  un  très  grand  nombre,  m,  de  tirages,   %  blanches 

sont  sorties  et  m  —  tx  noires.  —  sera  très  voisin  de  p  qui  est 

m 

ici  égal  à  : 

1  a         ,1        ji." 

2  a  +  V  "^  2  |x'  +  v'* 
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Mais  la  loi  des  écarts  sera-t-elle  la  même?  Il  ne  peut  en 
être  ainsi. 
Supposons  que  la  première   urne  ne  renferme  que  des 

blanches,  la  seconde  que  des  noires  :  nous  aurons  tiré  — 

blanches  et  —  noires.  —  sera  ée-al  à  -  '  et  l'écart  sera  nul, 

p  étant  aussi  -•  La  valeur  probable  de  À^   sera  zéro;   elle 

devrait  être  égale  à  -  »  car  : 

1        1       1 

^^=2^2  =  -V 

La  loi  des  écarts  n'est  donc  pas  la  même. 

5.  Je  veux  montrer  que,  si  une  autre  cause  que  le  hasard 
intervient,  l'écart  probable  (ou  la  valeur  probable  de  À')  sera 
plus  petit  que  si  le  hasard  seul  avait  agi. 

Les  m.  épreuves  forment  deux  catégories,  l'une  de  fim, 
l'autre  de  p'm  épreuves,  et  l'on  a  : 

p  -f  8'  =  1. 

Supposons  que  les  événements  A  et  B  aient  respective- 
ment, pour  probabilités,  p  et  q  dans  la  première  catégorie, 
jo'  et  q   dans  la  seconde. 

L'événement  A  se  présente  a  fois  dans  la  première,  a.'  fois 
dans  la  seconde  ;  B  se  présente  ^m  —  a  et  fl'm  —  %  fois. 

Le  nombre  total  des  épreuves  favorables  à  A  sera  a  -{-  ac'  ; 

OC  oc 

a  sera  très  voisin  de  S»?»,  et  ac'  de  S'm»';  ;: et  —, ,  s'écar- 

^  'imj>       \i  mp 

teront    très   peu   de    l'unité;    et    -f-   a'  sera    très   voisin  de 

pmp  4-  ^'tnp'-   c'est-à-dire   que    l'écart    sera  de  l'ordre  de 
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grandeur  de  y^m,  de  sorte  que  la  répétition  des  événements 
sera  à  peu  près  la  même  que  dans  une  seule  série  d'épreuves, 
où  les  probabilités  de  A  et  de  B  seraient  respectivement  : 

Sp  -\-  p'p'        et         S7  +  f^'q'. 

Cherchons  la  loi  des  écarts.  Je  vais  poser  : 

a  =  p?np  -{-  X  \/<^m 
a  =  p'mp'  -{-  X'  s/i^'m. 

Pour  l'épreuve  totale,  ce  serait  : 

a  4-  a'  =:  m  (^p  +  (i'p')  +  X"  \Jm, 

PP  ~\~  P'P   étant  la    probabilité   de  A  dans   Tensemble    des 
épreuves. 

Il  s'agit  de  calculer  la  valeur  de  X"-.  D'une  façon  générale, 
elle  est  égale  à  pq.  Si.  le  hasard  agissait  seul,  ce  serait  ici  : 

(3p  +  py)  (8g  -f  P'q'). 

Cherchons  sa  véritable  valeur  : 

X"  \'m  =  X  \/pm-\-  X'  \'(i'm, 
ou  : 

Les  deux  événements  sont  indépendants  :  la  probabilité 
pour  que  X  soit  compris  entre  deux  limites  données  est  indé- 
pendante de  la  probabilité  pour  que  X'  soit  compris  entre 
deux  limites  données.  Les  lois  de  probabilités  de  X  y/ fi  et  X'  \'fi> 
seront  normales,  et  la  loi  de  probabilité  de  leur  somme 
X  vp  -}-  X'  v^8'  sera  aussi  normale. 
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La  valeur  probable  de  À"^,  (X"^),  sera  : 

(X"2|  =  p  (X-^)  +  p'  (X'2)  =  ^pq  +  p'p'</. 

Telle  sera  la  véritable  expression  de  la  valeur  probable 
du  carré  de  l'écart. 

Comparons  les  deux  valeurs  ;  la  différence  est  : 

(3p  +  p'p')  [pq  -I-  fiVy')  -  {^pq  -\-  Pp'q'), 

ou,  eu  rappelant  que  (i  -\-  'i'  ^  \, 

{^p  +  b'p')  (Sry  +  r^'q)  -  (bpq  -\-  p'p'q')  (8  +  3'), 
c'est-à-dire  : 

^^'  {p'ï  -f  p'î  —  i^Y  —  p'9) 


ou  : 


Or  : 


p^'(p_p')(,/_^). 


P  — P 


La  différence  envisagée  est  donc  positive. 

6.  On  utilise  cette  propriété  dans  la  statistique.  On  a 
relevé  des  observations  dans  un  tableau,  et  on  veut  voir  si 
les  différences  observées  sont  dues  au  hasard,  ou  si  le 
hasard  n'intervient  pas  seul. 

On  compare,  pour  un  certain  nombre  de  cas,  le  rapport 
des  arrivées  de  A  à  celles  de  B,  et  on  calcule  la  loi  de  répar- 
tition des  écarts. 

On  répète  cet  examen  sur  plusieurs  séries,  et  on  observe 
si  la  loi  des  écarts  suit  bien  la  formule.  Si  une  loi  indépen- 
dante du  hasard  existe,  elle  agit  toujours  dans  le  même 
sens. 
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1.  Nous  avons  cherché    la  valeur  asymptotique  pour  m 
très  grand,  du  terme  : 

■}n  ! 
a  !  m  —  a  !  ^  ^ 

en  supposant  : 

0.  =:  ?np  -|-  X  v^?î. 

Cette  valeur  asymptotique  de  u^.  est  : 
e    ''P'i 


Je  pose  a  r=:  w£  ;  £    diffère  de  p,   et  je  cherche   la   valeur 
asymptotique  du  terme  correspondant.  On  a: 

1  =  [z  —  p)  \Jni. 

On  pourrait  donc  être  tenté  de  croire  que  la  valeur  asymp- 
totique est  : 

—  m  (c  —  ff)2 

e       ~PQ 


sj'i-nmpiq 


mais  cette  expression  est  inexacte. 

Nous  avons  supposé  qu'on  pouvait  négliger  des  ternies  tels 
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que   y=^  1  étant  fini  et  s  tn  infiniment  grand.  Nous   allons 
V  m 

chercher  à  former  l'expression  correcte  du  ternie  cherché. 

La  valeur  exacte  de  u^  est  : 


m  ! 


a,,//i—  a 


a  .  m  —  a  ; 


Si  m  et  a  sont  très  grands,  l'expression  asymptotique  de 
Ma  est  : 

m"'e-"'  V  2twÏ  „  „    „ 
= ^ — pat<y>w-a 

a*e-='  \  ^Tra  .  (w  —  a)'"-*  g- ("'-*)  \±r.  [m  —  a) 

Le  rapport  de  ces  deux  expressions  de  u^  tend  vers  Tunité 
toutes  les  fois  que  w  et  m  —  a  augmentent  indéfiniment,  et 
que  Ion  a 

a  =  £/W, 

e  tendant  vers  une  valeur  finie. 
Je  vais  simplifier  Texpression  asymptotique  de  Wa  : 


m 

a*  (m 


—  a)'"-«  V  2:ra  (»w  —  a)  ^  ^ 


Soit  a  =  z'in  ;  je  pose  : 

m  —  a  =:  s'/n, 
d'où: 

e'  =  1  —  e. 

L'expression  asymptotique  devient  : 
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et,  comme  m'"  =  ?n'"^  X  »'t"^^  '■ 


'int J      \me.' J        y    '^■Kmtt' 


Soit 


alors 


!*î 


A 

t'a  = 


2.    Nous    avions   trouvé,   pour  expression  asymptotique 
de  Ua, 

-IL 
e    -P^ 


Si  nous  avions  donné  à  X  la  valeur  (e  —  p)  sjm, 


'Ipq 


y^Tzjnpq 

Ce  n'est  pas  le  même  nombre  constant  qui  est  élevé  à  la 
puissance  m  dans  les  deux  expressions,  et  je  dis  que  A  est 
toujours  plus  petit  que  1 . 

e,  t'  restant  constants,  je  fais  varier  p  et  q^  en  les  laissant 
liés  par  la  relation  : 

p-f  <7  =  1. 

Quel  est  le  maximum  de  A  ? 

Ce  maximum  a  lieu  quand  ]fq^  est  maximum,  c'est-à-dire 
quand  p  et  5'  sont  proportionnels  à  leurs  exposants  : 

£  _  i  _  PjrJI  _  X 
e         e  £  +  e 
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Ainsi  le  niaximum  sera  atteint  quand 

et  alors 

A  =  l. 

Le  raisonnement  suivant  nous  fera  d'ailleurs  mieux  con- 
naître les  variations  de  A. 

3.  Je  vais  supposer  p  et  ^  constants  et  faire  varier  e  et  e'. 
Pour  cela,  je  considère 

A  p  q 

Comment  varie  ce  nombre?  Je  prends  sa  différentielle 
totale 

rfe  L  -  +  fW  L  -  +  rfs  +  ch'\ 
P  '1 

elle  doit  s'annuler  pour  qu'il  y  ait  maximum.  Mais  e,  t   ne 
sont  pas  indépendants. 

dt  +■  d=J  =  o 
Donc  : 

p  Q 

P     q      p-\-  q 

Le  maximum  sera  atteint  pour 

£  =  p,  £'='?, 

et  ce  maximum  sera  égal  à  l'unité. 

Comment  variera  A?  Je  fais  e  =  o,  A  est  égal  à  ç;  je  fais 
e  =  1,  A  est  égal  à  p. 
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A  part  de  q^  croît  jusqu'à   1  pour  e   =  p,  puis  décroît 
jusqu'à  p. 

4.  La  formule  qui  donne  une  valeur  approchée  de  n  !  est  : 

n  !  =  n"e~"  \Jn  F  (w). 

F  [n)  tend  vers  une  limite,  V'^t,  quand  n  augmente  indé- 
finiment. 


n  +  1!  =(n+  1)"  +  '  e-"'  +  ')  Vw  -f  1  F  (n-j-1) 
On  en  tire  : 


F  (n  -f  1) 


)"  '  V'-r 


F  {n)  \n  -\-  Ij        V  w  +  1 

Il  s'agit  de  savoir  si  F  [n]  va  en  croissant  ou  en  décrois- 
sant avec  w,  c'est-à-dire  si  le  logarithme  du  premier  membre 

est  positif  ou  négatif. 

1 

Je  divise  le  second  membre  par  n  -|-  -;  il  reste  : 


"  +  ï 


0+^) 


1 

Je  pose  7)  =:  —  et  je  considère  la  fonction 

{ 

?  i^)  =  ï î  —  L  (1  +  ^'). 


c'est-à-dire 


x'^  ^ 


'2x 
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<p  {x)  est-il  posilil"  ou  néf^atil'  x  varie  de  0  ii  1. 

2 
Pour  a;  ==  0,  5  (o)  =  o;  pour  a;  =  1,  ;.  (1)  =  q  —  L2. 

Comme  L2  =  0,69 ,  cp  (1)  est  négatif. 

Il  faut  voir  si  la  dérivée  s'annule  : 


2  (a;  4-  2)  —  2a;  1 


[x  +  2)--«  a;  +  1 

*?    1^-    ~   (07  +  2j2  iC   +    1   ~  (07  4-  1)   (£C   +  2j  = 

Le  dénominateur  est  toujours  positif;  le  numérateur  est 
égal  à  —  x^.  ^'  (x)  est  toujours  négatif,  par  conséquent  f(x) 
décroît;  donc  elle  reste  négative  et 


Si  : 

et  l'on  a  : 
c'est-à-dire  : 
On  a  aussi 


F  («  4-  1)<  F  in) 

1  =e-'  F  (1) 

F  (l)  =  e. 
F  (x)  =  v"2^. 


F(n)  va  toujours  en  décroissant,  mais  la  décroissance  n'est 
pas  très  grande,  car 

e  =  2,8 et         \^.  =  2,3.  ... 

5.  Ecrivons  la  valeur  de  «a  '■ 


m'"  „        ^  ^  /        f^  F  (''w) 

_  ^m-x  11  y  3^  („j  —  a)  F  (a)  F  (//«  —  a) 
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Il  s'agit  de  trouver  une  limite  supérieure  de  cette  expres- 
sion. D'abord 

F  [m)  <  F  [m  —  a), 
donc  : 

F  im)  1 

< 


F  (a)  F  (m  —  a)        F  (a) 

Or  pT^-  est  lui-même  plus  petit  que"^;  la  valeur  asymp- 
totique  de  m»  est  en  même  temps  une  limite  supérieure. 

6.  Quelle  est  la  probabilité  pour  que  a  soit  plus  petit  que 
tm  ? 

Cette  probabilité,  II,  est  : 

n  =  wq  +  ^u  +  •••  +  "p. 

avec  : 

|3  <  £?;i,      P  +  1       ^  t)n. 

Je  suppose  : 

t  <  p. 

Je  vais  d'abord  écrire.: 

p  -f-  1  =z  em. 

Uq,  k,,...  up  vont  en  croissant. 

n<«p+,  (p  +  1). 

Nous   avons   une    limite    supérieure   de    u^  +  ^•,   si    donc 

8  +  1  zzz  em, 

„  A'"em 

n  <  i 
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OU  : 

Soit  maintenant  : 

P  +  1  >  em. 
Alors  : 

n  <  wp  (8-I-1)- 

Il  s'agit  de  trouver  une  limite  supérieure  de  up;  je  pose  : 

A  =  cp  (e). 

Si  -^  était  éffal  à  e,  on  aurait  : 
m  " 


"?  <  h  Ci)]  "  n/îs 


!zB  (m  —  ^) 

Or  A  est  une  fonction  de  e  qui  va  en  croissant  avec  e 
jusqu'à  £  =  p.  el  9  ^s)  >  o  (^^j- 

Comme  il  s'agit  d'avoir  une  limite  supérieure, 

,      ,   /         m 

D'ailleurs  ^  est  supérieur  à  em  —  1  : 

fj  >  em  —  1,         m  —  p  >  s'???  —  1. 
Donc  : 


MS  <  A'' 


s/^ 


[em  —  1)  [t'm  —  1) 
Pour  en  revenir  à  n,  inférieur  à  ur^i  (S  4-  1),  nous  remav- 
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querons  que  [i  -f-  1  est  lui-même  inférieur  à  tm  -f- 1  ;  et  nous 
arriverons  finalement  à  une  formule  un  peu  plus  compliquée 
que  pour  em  entier  : 


tm  entier,         11  <  A' 


I  tm 


un  non 


entier,         n  <  A'"  \/  r-y =^j--^^ tt 

V   27t  {=m  —  1)  (e  m  —  1) 


Ainsi  : 

La  probabilité  pour  que  a  soit  plus  petit  que  ew,  si  e  est 
plus  petit  que  p,  est  toujours  inférieure  à  l'une  ou  l'autre 
quantité  que  nous  venons  de  calculer  ci-dessus. 

Cette  probabilité  tend  vers  zéro  quand  m  croît  indéfini- 
ment, pourvu  que  e  <  p.  C'est  le  théorème  de  Bernouilli, 
qui  peut  s'énoncer  encore  ainsi  : 

La  probabilité  pour  que  a  soit  compris  entre  mp(l  —  6) 
et  mp(l -|- ô)  tend  vers  l'unité  quand,  6  restant  constant, 
m  croît  indéfiniment. 

7.  Nous  avons  été  amenés  à  considérer  un  nombre  très 
grand  de  cas  possibles,  mais  ce  nombre  restait  fini.  A  cer- 
tains moments,  nous  avons  envisagé  des  questions  de  limites 


et  remplacé  les  S  par  des    • 


Nous  allons  arriver  aux  problèmes  où  le  nombre  des  cas 
possibles  devient  infini. 

Il  faut  bien  définir  ces  cas,  et  un  paradoxe  de  M.  Ber- 
trand mettra  bien  en  évidence  le  genre  spécial  d'erreurs  que 
ces  problèmes  peuvent  entraîner;  il  s'agit  de  la  question 
suivante  : 

Quelle  est  la  probabilité  pour  qu'une  corde  d'une  circon- 
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férence  donnée  soit  plus   grande    que   le  côté  du   triangle 
équilatéral  inscrit? 

M.   Bertrand  traite  le  problème  de  deux  manières,  et  les 
résultats  sont  absolument  op- 
posés. 

Soit  AB  la  corde  ;  nous 
prendrons  le  rayon  OA  comme 
unité,  les  coordonnées  polaires 
de  A  seront  1  et  'd. 

Soit  'j.  l'angle  AOM ,  OM 
étant  la  perpendiculaire  abais- 
sée du  centre  sur  la  corde,  P 
le  point  où  cette  perpendicu- 
laire rencontre  la  courbe  et  M  le  milieu  de  la  corde. 

L'angle  POo-,  ou  0,  est  égal  à  a  -|-  «). 


FiG.  3. 


8.  Premier  raisonne inenl.  —  Le  point  A  peut  se  trouver 
en  n'importe  quel  point  de  la  circonférence.  La  probabilité 
pour  que  c.j  soit  compris  entre  co^  et  w,  est  proportionnelle  à 


la  différence 


Le  point  A  déterminé,   la  corde  peut 


prendre  toutes  les  directions  possibles,  c'est-à-dire  que,  A 
étant  choisi,  je  puis   faire  prendre  à   a  toutes  les  valeurs 

possibles  entre'O  et  -^ 

La  probabilité  pour  que  a  soit  compris  entre  a^  et  a,  est 
proportionnelle  à  a,  —  ocq.  Si  AB  était  le  côté  du  triangle 
équilatéral  inscrit,  %  serait  égal  à  60°. 

Comme  a  peut  prendre  toutes  les  valeurs  de  0°  à  90°,  la 
probabilité  pour  que  la  corde  soit  plus  grande  que  le  côté 
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du  triangle  est  : 

900  _  epo  _  1 

900  _  O»  ~  3* 

9,  Deuxième  raisonnement.  —  La  corde  peut  avoir  une 
direction  quelconque.  La  probabilité  pour  que  0  soit  compris 
entre  0^  et  6^  est  proportionnelle  à  0,  —  0^. 

Cette  direction  une  fois  choisie,  je  trace  OP  :  la  droite  AB 
sera  définie  quand  je  connaîtrai  le  point  M,  c'est-à-dire  la 
distance  OM  =  p  =  cos  a. 

p  peut  prendre  toutes  les  valeurs  de  0  à  1  ;  on  doit  admettre 
que  la  probabilité  pour  qu'il  soit  compris  entre  Pq  et  p,  est 
proportionnelle  à  p,  —  p^. 

Si  OM  est  compris  entre  0  et  -<  la  corde  est  plus  grande 

que  le  côté  du  triangle. 

1 
La  probabilité  sera  donc    • 

Pourquoi  cette  contradiction  ?  Nous  avons  fait  des  hypo- 
thèses difl'érentes  dans  les  deux  cas,  nous  avons  défini  la 
probabilité  de  deux  manières  différentes. 

10.  D'une  manière  générale,  on  demande  de  définir  la 
probabilité  pour  qu'un  nombre  x  soit  compris  entre  x^  et  x^  : 
en  général,  nous  pouvons  dire  que  nous  n'en  savons  rien  du 
tout. 

Cette  probabilité  doit  dépendre  de  Xq  et  de  x^  :  ce  sera 
donc  une  fonction  telle  que  P  {xq,  x,). 

Si  nous  cherchons  la  probabilité  pour  que  x  soit  comprise 
entre  x^^  et  X2, 

Xq  <c.  x^  <c  Xij^ 

en  vertu  du  principe  de  la  probabilité  totale,  cette  probabi- 
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lité  sera  : 

P  (iCo.  X.;,)  =  P  (o^o,  a;,)  +  P  (a;^,  x^). 

Si: 

x.^  =  -^'i  -{-  C?«^(  1 
on  a  : 

P  (a;.,,  X,)  -  P  {x„  0-,)  =  P  (.^0-  ^.  -h  ^^.)- 

Cette  probabilité  sera  infiiiimeiit  petite,  et,  en  divisant  par 
dx^ ,  elle  ne  dépendra  que  de  «;^ . 
On  aura  donc  dans  tous  les  cas  : 

P{x^,Xi)  =         o  {x)  dx. 

Mais  nous  ignorons  la  nature  de  cp  (x)  qui  reste  arbitraire  : 
il  faut  nous  la  donner  au  début  du  problème  par  une  conven- 
tion spéciale  pour  qu'il  ait  un  sens. 

De  même,  la  probabilité  pour  que  le  point  {x^i/)  soit  à  l'in- 
térieur d'une  aire  donnée  est  : 


Il  cp  {x^y)  dx  dy, 


l'intégrale  double  étant  étendue  à  tous  les  éléments  de  l'aire  ; 
mais  nous  ne  connaissons  pas  s  [x,y) . 

Le  mathématicien  n'a  plus  aucune  prise  sur  le  choix  de 
cette  hypothèse;  mais  il  doit,  une  fois  qu'elle  est  choisie, 
porter  son  attention  à  ne  pas  en  faire  une  autre  ({ui  la  con- 
tredise. 

11.  L'on  peut  avoir  plusieurs  paramètres  x^,x.2y..^,  Xp. 
L'intégrale  d'ordre  p, 

1  z,  {x^,x.;^,  ...  Xp)  dx^  (/tTo  ...  dx,,^ 
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définira  alors  la  probabilité  pour  que  les  paramètres  x  satis- 
fassent à  certaines  conditions,  quand  la  fonction  cp  eU 
définie;  il  n'y  aura  qu'à  étendre  l'intégration  à  toutes  les 
valeurs  des  x  qui  satisfont  aux  conditions  données.  Mais 
cette  définition  n'aura  de  sens  que  quand  on  se  sera  donne 
la  fonction  cp  par  une  convention  préalable. 

Je  suppose  qu'on  change  de  variables  et  qu'on  prenne 
2/n  y %•,••• -l'y p  'i  l'intégrale  va  se  transformer  en 

à  l'aide  du  jacobien  ou  déterminant  fonctionnel  des  x  par 
rapport  aux  y. 

Cette  nouvelle  intégrale  multiple  est  entièrement  déter- 
minée ;  on  étendra  l'intégration  aux  limites  des  y  qui  corres- 
pondent à  celles  des  x,  et  qui  sont  connues,  puisqu'on  con- 
naît les  relations  qui  lient  les  x  et  les  y. 

12.  Appliquons  ceci  au  paradoxe  de  M.  Bertrand. 

Dans  la  première  manière  de  raisonner,  les  variables 
étaient  co  et  a,  dans  la  seconde  0  et  p. 

Dans  la  première  manière,  la  probabilité  pour  que  w  fût 
compris  entre  coq  et  w^  était  proportionnelle  à  w,  —  co^  ;  pour 
que  a  fût  compris  entre  t^  et  a^,  elle  était  proportionnelle  à 
a,  —  ag. 

Cette  probabilité  se  représentait  par 

di»  d% 


If' 


étendue  à  tous  les  systèmes  de  valeurs  de  w  et  a  qui  satis- 
faisaient à  ces  conditions. 
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Dans  la  seconde  manière,  nous  avons  supposé  que  0  et  p 
pouvaient  prendre  toutes  les  valeurs  possibles  avec  une 
égale  probabilité,  et  nous  avons  représenté  la  probabilité 
cherchée  par 

c/0  dp 


ff^ 


Ces  deux  hypothèses  ne  sont  pas  les  mêmes,  comme  nous 
l'avons  déjà  constaté  directement.  Ciierchons  le  déterminant 
fonctionnel  ;  on  a  : 

dp  =  —  sin  a  da.  ;         c/0  =  dia  -f-  dx. 

Ce  déterminant 

0  —  sin 

1  1 

est  égal  à  sin  a.  Donc  la  deuxième  intégrale  est  : 
1  sin  a  dw  dx, 

ce  qui  n'est  pas  la  même  chose  que  la  première. 

13.  Autre  exemple.  —  Soit  une  droite  AB,  dans  un  plan  ; 

1      1 

ses  coordonnées  tangentielles  sont-  et  -«La probabilité  pour 

que  a  ei  b  prennent  toutes 
les  valeurs  comprises  entre 
certaines  limites  peut  être 
par  une  première  conven- 
tion représentée  par  : 


ffda  bd, 


Fid.  4. 


où  è  =  a  tg  w,  si  w  est  l'angle  de  AB  avec  Ox. 
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On  peut  aussi  dire  :  to  peut   prendre  toutes   les   valeurs 
possibles  ;  d'où  pour  la  probabilité 


// 


da  du 


Ce  n'est  pas  la  même  chose,  et  cette  seconde  convention, 

qui,   après  un  examen  superficiel,   pourrait    sembler    aussi 

légitime  que  la  première,  est  en  contradiction  avec  elle  ;  en 

(i 
effet,  le  déterminant  fonctionnel  est  — tt-i  et 

cos^'œ 


II 


da  db  ^=  Il —  da  do 

}  /    COS-  0) 


DEPARTMENT  OF  MMH£MM>CS 
UNWERSnV  OF  TORONTO 
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1.  On  partage  un  bâton,  do  longueur  1,  en  trois  parties 

X,  y,  z. 

X  -\-  y  -\-  3-  — :  1 . 

La  probabilité  pour  que  x  soit  compris  entre  x  q\x  A^  dx 
sera  par  définition  proportionnelle  à  dx\  entre  aj^  et  a-,,  à 

X^  X'q. 

La  probabilité  pour  que  y  soit  compris  entre  y^  et  y^  sera 
proportionnelle  à  ?/,  —  y^,  etc. 

La  probabilité  pour  que  x  et  y  satisfassent  à  certaines  posi- 
tions est  l'intéo-rale 


Jj  dxdy 


étendue  à  toutes  les  valeurs  de  a;  et  de  ?/  qui  satisfont  à  ces 
positions. 

Cette  probabilité  serait  aussi 


/  /  dxdz, 


et  aussi 


JJdydz, 
puisqu'on  peut  prendre  x  et  z,  ou  l)ien  y  et  z  comme  variables. 
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Ces  trois  définitions  sont  ici  équivalentes,  on  a 


jj^*  =£/;.*  g^ 


et  le  déterminant  fonctionnel  est  bien  égal  à  1. 


z  =  \  —  X 


y- 


2.  Quelle  est  la  probabilité  pour  que  x,  y  ei  z  forment  un 
triangle  ? 

Traçons  un  triangle  équilatéral  dont  la  hauteur  soit  1  :  d'un 
point  M,  intérieur  à  ce  Iriangle,  abaissons  des  perpendicu- 
laires sur  les  trois  côtés.  La   somme 
des  trois  longueurs  ainsi  obtenues  sera 
égale  à  la  hauteur  du  triangle,  c'est-à- 
dire  à  1  ;  elles  repré- 
senteront    les      trois 
morceaux,  x,  y,  z,  du 
bâton. 
Le  point  M  peut  être  considéré  comme  représentant  le 
mode  de  division  du  bâton  :  quelle  est  la  probabilité  pour  que 
ce  point  soit  à  l'intérieur  d'une  certaine  aire  ? 

La  probabilité  pour  que  x  soit  comprise  entre  x  eix-\-  dx^ 
et  pour  que  y  soit  comprise  entre  y  çX  y  A^  dy,  est  propor- 
tionnelle à  dxdy.  Le  point  M  sera  alors  dans  une  aire  con^- 
prise  entre  deux  parallèles  à  BC  menées  à  des  distances  x  et 
œ  -\-  dx  àe  BC,  et  deux  parallèles  à  AC  menées  à  des  dis- 
tances y  ei  y  -{-  dy  de  AC.  Le  parallélogramme  ainsi  formé 


Fu 


FiG.  6. 
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a  pour  angles  420  degrés  et  60  degrés,  et  son  aire  est 

dxdy 


sin  60° 

La  prohabilité  sera,  dans  ce  cas,  proportionnelle  à  l'aire  du 
parallélogramme;  et,  en  général,  elle  sera  proportionnelle  à 
l'aire  envisagée. 

Le  point  M  devant  être  à  l'inlérieur  du  triangle  ABC,  la 
probabilité  pour  qu'il  soit  à  l'intérieur 
d'une  certaine  aire  est  le   rapport  de 
cette  aire  à  la  surface  du  triangle. 

Joignons  par  des  droites  les  milieux 
A'  B'  C  des  côtés  du  triangle.  M  doit 
être  à  l'intérieur  de  A'  B'  C  pour 
qu'on  puisse  former  un  triangle  avec 
a;,  ?/,  z  \  si  le  point  M  est  sur  l'un  des  côtés  de  A'B'(],  Tune 
des  équations   suivantes  est  satisfaite: 


z  =  x-\-  y, 


y  +  ^. 


y 


X  -\-  z\ 


si  le  point  M  est  en  dehors  de  ABC,  l'une  des  trois  gran- 
deurs x,y^  z  est  plus  grande  que  la  somme  des  deux  autres. 
La  probabilité  pour  que  l'on  puisse  former  un  triangle 

1 

avec  x^  y,  z  est  donc  -• 


3.  Problème  de  l'aiguille.  —  Sur  une  feuille  de  papier, 
sont  tracées  un  certain  nombre  de  droites  parallèles  et  équi- 
distantes  ;  leur  distance  commune  est  d^  et  l'on  jette  au  ha- 
sard sur  la  feuille  une  aiguille  également  de  longueur  d. 

Quelle  est  la  probabilité  pour  que  cette  aiguille  rencontre 
l'une  des  droites? 
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La  question  peut  se  poser  d'une  manière  plus  générale. 
Soient  deux  axes  fixes  ox^  oy,  et  une  fîg-ure  fixe  F  invaria- 
blement liée  à  ces  axes. 


<— O^. 


FiG.  8. 

Soient  d'autre  part  deux  axes  mobiles  OX,  OY,  et  un 
figure  Fj  invariable  de  forme,  mais  invariablement  liée  à  ces 
axes,  et  par  conséquent  mobile  avec  eux. 

Définissons  la  position  de  la  figure  mobile  par  rapport 
aux  axes  fixes. 


FiG.  9. 


Soit  M  un  de  ses  points,  MP  une  droite  passant  par  M  et 
invariablement  liée  à  la  figure  V ^  :  il  suffît  de  définir  la  posi- 
tion de  MP  par  rapport  à  xoy.  Cette  position  est  définie  par 
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les  coordonnées  xy  du  poiiil  M  et  lanyle  to  de  MP  avec  ox. 
La  probabilité  pour  ([ue  M  satisfasse  à  certaines  conditions 
est  proportionnelle  à 

/  //  clxdydM. 

Pour  justifier  cette  définition,  je  vais  montrer  qu'elle  est  la 
même  quand  je  prends  un  autre  point  M'  delà  figure  mobile, 
ainsi  ([u'une  autre  droite  M'P'. 

La  droite  M'P'  sera  invariablement  liée  à  MP. 

Soient  /  la  longueur  MM',  a  l'angle  de  MM'  avec  MP  et  p 
l'angle  de  M'P'  avec  MP  :  /,  a,  p  sont  des  constantes. 

La  droite  M'P'  est  définie  relativement  aux  axes  xoy  par  les 
coordonnées  x'y  du  point  M  ,  et  l'angle  w'  de  M'P'avec  ox. 

Si  la  probabilité  pour  que  la  figure  mobile  satisfasse  à  cer- 
taines conditions  est,  d'après  la  première  évaluation, 

/  /  /  dxdydiM, 
elle  sera  aussi  : 

/  /  /  dx'dy'dM  . 

Le  déterminant  fonctionnel  est  en  effet  égal  à  l'unité;  on  a, 
par  projections, 

X    ■^=  X  -\-   l  COS  ('(0  -f-  3t) 

y'  =  y  ~\-  l  sin  Uo  -f-  x) 

to    r=  oi  -j-  S 

et  le  déterminant  fonctionnel  \  ,  !    est  : 

c  ix,y,(i>) 

l  0  —  l  sin  (m  -j-  a) 

0  1  ^  COS  (co  +  y.) 

0  0  1 

c'est-à-dire  1. 
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La  loi  de  probabilité  est  donc  la  même,  quelle  que  soit  la 
droite  MP  choisie. 

4.  Si  je  considère  deux  figures  cp,  'f',  égales  entre  elles  et 
invariablement  liées  aux  axes 
mobiles,  la  probabilité  pour  que 
^'  satisfasse  à  certaines  condi- 
tions est  égale  à  la  probabilité 
pour  que  tp  satisfasse  aux  mêmes 
conditions.  Considérons  une 
droite  MP  invariablement  liée  à 

(f  et  une  autre  droite  M'P'  dont  la 

FiG.  10.  ...  t   '       f        ^  1 

position  par  rapport  a  f  est  la 

même  que  celle  de  MP  par  rapport  à  cp  ;  soient  ir,  ?/,  w,  d'une 

part,  sc\  y\  w',  d'autre  part,  les  quantités  qui  définissent  la 

position  de  ces  deux  droites. 

La  position  de  <y  est  définie  par  x,  y  et  oj;  celle  de  ^',  par 
x\  y',  co'.  Pour  que  cp  satisfasse  à  certaines  conditions,  œ,  t/,  to 
devront  satisfaire  à  certaines  inégalités.  Pour  que  cp'  satis- 
fasse aux  mêmes  conditions.  x\  y\  co'  devront  satisfaire  aux 
mêmes  inégalités.  A  la  dilïérence  près  des  notations,  on  re- 
tombe donc  sur  la  même  intégrale. 

La  valeur  de  la  probabilité  est  donc  la  même  dans  les  deux 
cas. 

5.  On  demande  la  probabilité  pour  qu'un  segment  de  droite 
limitée,  MP,  rencontre  les  parallèles  du  problème  de  l'ai- 
guille. Si  une  seconde  droite,  M'P',  de  même  longueur,  est 
invariablement  liée  à  MP,  la  probabilité  pour  qu'elle  rencontre 
les  parallèles  sera  la  même. 

Si,  au  lieu  de  MP,  on  considère  une  droite  deux  fois  plus 
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long'ue,  MQ,  la  probal>ililt'  sera  doublée,  puisqu'elle  secoui- 
pose  de  deux  droites  égales  à  MP,  à  savoir  MX  et  NQ,  X  étant 
le  milieu  de  MQ. 

Je  suppose  qu'on  promette  à  un  joueur  autant  de  francs 
qu'il  y  aura  de  points  d'intersection  de  la  droite  avec  les 
parallèles  (').  T/espérance  niatliéiuatique  du  joueur  avec  MQ 
sera  double  de  son  espérance  avec  MN,  puisqu'elle  sera 
celle  qu'il  tire  de  MX  augmentée  de  celle  (ju'il  tire  de 
NQ.  En  général,  elle  sera  proportionnelle  ii  la  longueur  de 
la  droite. 

Si  NQ  n'est  pas  dans  le  prolongement  de  MN,  l'espérance 
mathématique  est  encore  doublée.  L'espérance  mathéma- 
tique est  donc  proportionnelle  à  la  longueur  totale  de  la 
ligne,  qu'elle  soit  droite  ou  brisée,  ou  même,  en  allant  plus 
loin,  quelle  que  soit  sa  forme. 

Si  on  promet  autant  de  francs  que  de  points  d'intersection 
de  la  courbe  avec  les  parallèles,  l'espérance  mathématique 
sera  ainsi  proportionnelle  k  la  longueur  de  la  courbe. 

Si  la  courbe  est  une  circonférence  de  diamètre  f/,  sa  lon- 
gueur sera  -kcI;  dans  ce  cas  il  y  aura  toiijours  deux  points 
d'intersection,  l'espérance  mathématique  sera  donc  2.  Pour 
une  courbe  de  longueur  s,  cette  espérance  sera  ~-\\  pour  une 

droite  de  longueur  f/,  — 

6.  Revenons  sur  le  paradoxe  de  M.  Bertrand,  la  probabi- 
lité pour  qu'une  corde  d'une  circonférence  soit  plus  petite 
que  le  côté  du  triangle  équilatéral  inscrit. 

Traçons  une  circonférence  C,  concentrif|ue  à  la  première 
C  et  dont  le  rayon  soit  la  moitié  du  sien.  Plaçons  au  hasard 

(')  Bien  entendu,  si  l'une  des  extrémités  de  MX  tombe  sur  une  des 
parallèles,  cela  comptera  pour  1/2  intersection. 
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une  droite  dans  le  plan.  Si  nous  adoptons  la  convention  faite 
tout  à  l'heure  au  sujet  de  l'aiguille,  la  probabilité  dépendra- 
t-elle  d'une  nouvelle  et  troisième  hypothèse,  ou  bien  do  Tune 
des  deux  précédemment  examinées  ? 

Je  puis  supposer  la  droite  fixe  et  les  circonférences  mobiles. 
La  pro])abilité  pour  que  l'une  des  circonférences  coupe  la 
droite  est  proportionnelle  à  sa  longueur;  la  probabilité  pour 
que  C  rencontre  la  droite  est  donc  le  rapport  des  longueurs 

{ 

des  deux  circonférences,  c'est-à-dire  -•  On  retombe  ainsi  sur 

l'une  des  hy})othèses  de  M.  Bertrand. 

7.  Voici  un  problème  analogue  : 

Sur  une  sphère  S  on  trace  une  figure  mobile  ;  quelle 
est  la  probabilité  pour  que  cette  figure  satisfasse  à 
certaines  conditicns  ? 

Comment  définir  d"al)ord  la  position  de  cette  figure? 

Soit  P„  la  position  initiale,  P,  la  position  finale  de  la  figure 
mobile:  on  passe  de  l'une  à  l'autre  par  une  rotation  conve- 
nable, définie  par  l'axe  de  rotation  et  l'angle  de  rotation. 

Soient  a,  8,  y  les  cosinus  directeurs  de  l'axe,  et  26  l'angle 
de  rotation  ;  posons 

X  =  cosO,  jj.  =  IX  sinO,  v  =  p  sinO,  p  ^=  Y  sinO, 

et  prenons  X,   a,  v,  p  comme  variables. 
Elles  sont  liées  par  une  relation  : 

X-  -|-  [x-  -\~  \-  -\-  ^-  ==■  i. 

Je  retrouve  la  même  rotation,  si  je  change  les  signes  de 
X,  [jL,  V,  p,  et  il  suffit  de  connaître  trois  de  ces  quantités. 
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Je    suppose  la  probabilité  représentée  par  une  intégrale 
triple 


l  chxrNch 
elle  sera  représentée  aussi  par 

J        !^ 


Cherchons  en  effet  le  déterminant  fonctionnel  des  nouvelles 
variables  À,  v,  p  par  rapport  aux  anciennes  a,  v,  p,  et  sup- 
posons X  défini  en  fonctions  de  ;/.,  v,  p. 

"kdl  =  —  u.(/a  —  vo?v  —  po^p. 

Le  déterminant  fonctionnel  est 


A 

X 

X 

0 

1 

0 

0 

0 

1 

Ainsi,   au   signe   près,   par  le  changement   de  variables 
l'élément  de  l'une  des  intégrales  triples  devient  l'élément  de 

l'autre  intégrale  après  multiplication  par  ^• 


d[xdydp 


et 


dhd^do 


donnent  donc  bien  la  même  définition  pour  la  probabilité. 
Voici  comment  se  justifie  cette  convention  :  considérons  la 
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sphère  : 

a;2  -f  y2  _|_  ^2    _|_ 

Supposons  que  la  probabilité  pour  qu'un  point  quelconque 
de  la  sphère  se  trouve  à  l'intérieur  d'une  certaine  aire  sphé- 
rique  soit  proportionnelle  à  cette  aire.  Cette  aire  s'exprimera 


par 


l'intégrale 


r>' 


dxdy 


cos  «S 


dœdy 


cos  nS  étant  le  troisième  cosinus  directeur  de  la  normale  à 
la  sphère  au  point  considéré. 

Nous  avons  fait  ici  une  hypothèse  tout  à  fait  analogue,  car 

X^  -f  ,j.2  _[-  v2  -}-  p^  =  1 

serait  l'équation  d'une  sphère  dans  l'espace  à  quatre  dimen- 
sions. 

8.  Je  suis  parti  précédemment  de  la  position  initiale  P^. 
La  rotation  X,  a,  v,  p  ne  dépend  pas  seulement  de  P,,  elle 
dépend  aussi  du  choix  de  la  position  initiale  P^. 

Je  vais  démontrer  que  la  probabilité  reste  la  même,  si,  au 
lieu  de  la  position  initiale  P,,,  on  en  considère  une  autre  P'^. 

La  rotation  de  P'^  à  P,  sera  définie  par  X',[i.',v',p',  et  la  pro- 
babilité sera  définie  par 

/  d\K    dV  dp 
J  ^ 

Je  dis  qu'elle  sera  proportionnelle  à  la  précédente. 
/,  m,  n,  ?'  définissant  la  rotation  de  P'^  à  P^,  la  rotation 
X',[x',v',p'  sera  la  résultante  de  deux  autres.  Les  formules  con- 


NEUVIEME    LEÇON 
nues  de  la  composition  des  relations  sont 
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X'  =    ;  /  —  'j.m  —  vn  —  p>' 
a  =  hn  -\-  \j.l  —  yr  -\-  on 
V  =  hi  -f-  [j.r  -j-  v/  —  pw 
c'  =  Ar  —  !^^  4"  ''"^  +  9^- 

Il  s'agit  de  calculer  le  déterminant  fonctionnel  de  X',[j.',v',p' 
par  rapporta  /,  a,  v,  p.  Je  pose  : 


V  ^''"  +  [J--  -j-  ''"  +  p'- 


Ici  5  =^  i,  mais  je  puis  supposer  à  X,  a,  v,  p  des   valeurs 
quelconques  au  lieu  des  valeurs  véritables. 
De  même  : 


(J     =^  V  X"   -f-  IJ.      -f~  ^      -\-  0  " . 

Quelles  que  soient  ces  valeurs,  on  a  : 


c'  =  a  \  P  4"  "■'"''  +  ■'^'  +  '"^î 
et  si  /,  m,n,  r  ont  les  valeurs  constantes  données, 


Il  s'agit  de  calculer  : 


^   (.«■,  V,  p) 


en  supposant  5  =  1,  c'est-à-dire 


7>u' 

Da 

?.;' 

7)<j. 

Dv 

cV 

7>V 

Sv' 

3v' 

Da 

ôv 

c^p 

Dp' 

^p' 

Dp' 

?a 

^/ 

2>p 
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Mais  je  vais  porter  le  nombre  des  variables  à  4,  et  consi- 
dérer d'une  part  s,  ;j.,  v,  p,  d'autre  part  (T',a',v',p'.  Comme 
c'  =  (7,  les  dérivées  partielles  de  a  seront  1,0,0,  0. 


1 

0 

0 

0 

V 

V 

7),/ 

Sa' 

?a 

3./. 

Sv 

Sp 

3v' 

Sv' 

Sv' 

Sv' 

Sa 

Sa 

Sv 

Sp 

7>p 

K 

Sp' 

Sp' 

D(T 

^^ 

Sv 

Sp 

C'est  bien  le  même  déterminant  fonctionnel;  on  peut  donc 
déjà  écrire  : 

S  ([a',v',p'j S(g',a',v  ,p')  _S  (q',a',v',p")^S  (X',a',v',p')  ^S('X,a,v,p)^ 

S  (!-«•, v,p)  S  ((7,;j.,v,p)  S(X',a',v',p')      S  (X,[/.,v,p)      S(ff,[x,v,p) 

Evaluons  successivement  les  trois  derniers  déterminants 
fonctionnels.  Le  premier  est 


Sa' 

S(t' 
Sa 

Sa 
Sv' 

Sa 

Sp 

0 

1 

0 

0 

0 

0 

1 

0 

G 

0 

0 

1 

Sa; 
SA' 


Le  second  est  : 


l 

—  m 

—  n 

—  r 

m 

/ 

—  r 

n 

n 

r 

l 

—  VI 

r 

—  n 

m 

l 

[P  -\-  m^  -h  n^  +  r2)2  -   l. 
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Le  troisième  est  : 

<)    À,a.v,p    1  1  ff 

Le  produit  des  trois  est  donc  ,->  et  l'intégrale: 


se  transforme  en 


J 


(  da'dV 

dp 

1     ^ 

d'xd'^dp 

X 

X' 

A 

X 

ou 


/■ 


d^xdvdc 


La  définition  de  la  probabilité  reste  donc  la  même,  quelle 
que  soit  la  position  initiale. 

9,  On  demande  la  probabilité  pour  que  cette  figure  P^ 
satisfasse  à  certaines  conditions. 

Si  on  considère  une  autre  figure  P'^  égale  à  la  première  et 
invariablement  liée  à  celle-ci,  on  peut  demander  aussi  la 
probabilité  pour  que  cette  seconde  figure  satisfasse  à  certaines, 
conditions.  Soient  alors  À,  [a,  v,  p  les  paramètres  de  la  rotation 
qui  amène  Pq  en  P,,  et  )/,  a',  v',  p'  ceux  de  la  rotation  qui 
amène  P'q  en  P,. 

La  probabilité  pour  que  P^,  venu  en  P^,  satisfasse  à  cer- 
taines conditions,  est  représentée  par 

/d'j-d^id:) 

CAI.CVL    DE?    PROBABILITÉS.  8 
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les  paramètres  l,  jj.,  v,  p  devant  satisfaire  à  certaines  inéga- 
lités. 

La  probabilité  pour  que  P,,  venu  en  P,  satisfasse  aux  mê7nes 
conditions  est  représentée  par 


X' 


les  paramètres  )/,  ij.',  v',  p'  devant  satisfaire  aux  mêmes  inéga- 
lités. Les  intégrales,  ne  différant  que  par  les  notations,  sont 
identiques,  et  la  probabilité  reste  la  même. 

Les  probabilités  pour  que  deux  figures  mobiles,  égales,  et 
invariai )lement  liées  l'une  à  l'autre,  satisfassent  à  une  même 
condition,  sont  donc  égales  entre  elles. 

10.  Choisissons  une    autre  forme  où  n'apparaîtront  pas 

X,    [7.,   V,    p. 

Je  définis  la  position  d'un  point  M  de  la  figure  mobile  par 
ses  coordonnées  a?,  y,  z  et  celle  d'un  arc  de  grand  cercle  MP 
par  l'angle  w  que  faitMP  avec  MA,  MA  étant  un  arc  de  grand 
cercle  qui  passe  par  un  point  fixe  A. 

La  probabilité  s'écrira 


où  W  est  une  fonction  de  a?,  y,  z  et  co. 
En  prenant 

dxdy  =  zdc^ 

dd  est  l'élément  de  surface  de  la  sphère  et  l'intégrale  devient 

/  *hd<sd(jy. 
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Cette  intégrale  doit  être  étendue  à  tous  ceux  des  éléments 
c  de  la  surface  de  la  sphère  et  à  toutes  les  valeurs  de  l'angle 
w  qui  satisfont  aux  conditions.  En  revenant  k  x  et  y  comme 
variables,  elle  s'écrit: 


C^dxdy 


11.  .Te  dis  que  la  forme  de  *i>  reste  la  même  quelle  que  soit 
la  position  de  A.  ^p' 

Considérons  un  autre  point  iixe  B,  et 
soit  co'  l'angle  de  MP  avec  MB,  p  celui  de  MB 
avec  MA. 

A. 


=  co  +  8. 


Fin.  11. 


Au  lieu  de  x,  y,  to,  les  variables  seront  a?,  y,  w'. 
Le  determmant  lonclionnel  -^7 — '-  est  égal  a  : 


t>  {x,  y,  co) 


1 

0 

'bx 


0 

1 


=  1 


12.  La  fonction  $  est  indépendante  de  co. 
En  effet,  considérons  un  autre  arc  de  grand  cercle  MP',  et 
soit  m"  langle  de  MP'  avec  ^lA,  7.  l'angle  de  MP'  avec  MP. 

co    =  0)  -j-  a. 

La  loi  de  probabilité  ne  sera  pas  changée. 


/ 


<ï)C?(JC/oj 
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exprime  la  probabilité  pour  que  MP  satisfasse    à  certaines 
conditions. 


f^d^diû" 


exprimera  la  probabilité  pour  que  MP' satisfasse  à  ces  mêmes 
conditions.  Ces  deux  probabilités  doivent  être  égales,  <î>  ne 
dépendra  donc  pas  de  co. 

13.  La  fonction  <i>  ne  dépend  pas  non  plus  de  x  et  y. 
Soient  en  effet  de  et  dtr'  deux  éléments   de  surface  de  la 
sphère  égaux  entre  eux.   Soient  /,  w,  n,  r  les   paramètres 

d'une  des  rotations  qui  change 
f/ff  en  drs .  Soient  X,  ij.,  v,  p  ceux 
d'une  rotation  qui  amène  la 
figure  mobile  dans  une  posi- 
tion telle  que  M  soit  intérieur  à 
d(s.  Soient X',  [jL,  v',p' ceux  d'une 
rotation  qui  amène  M  à  l'inté- 
rieur de  d(s' . 

Soient  x^  y  les  coordonnées 
du    centre    de  gravité   de   ds, 
x\y  celles  du  centre  de  gravité  de  c/a. 

Les  paramètres  X',  a',  v',  p'  seront  des  fonctions  linéaires 
de  X,  [jL,v,  p  d'une  part,  de  l,  m,  n,  r  d'autre  part;  on  n'a  en 
effet  qu'à  se  reporter  à  la  formule  de  composition  des  rota- 
tions citée  plus  haut.  On  aura  d'ailleurs,  comme  nous  l'avons 
vu  plus  haut  : 


FiG.  12. 


/du.d-^d^ /  du.'dVdç,' 
X    =  I  "^r~ 
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La  probabilité  pour  que  M  soit  intérieur  à  du  est  : 

Tc/u)  Ç^d<s  —  i~^{x,y)d<5  =  j  -^/     • 

les  paramètres  X,  (jl,  v,  p  devant  satisfaire  à  des  inégalités  qui 
expriment  que  la  rotation  correspondante  amène  M  à  l'inté- 
rieur de  f/ff,  et  l'intégrale  étant  étendue  à  toutes  les  valeurs 
de  ces  paramètres  qui  satisfont  à  ces  conditions 
La  probabilité  pour  que  M  soit  intérieur  à  da  est  : 

^   ^  ,   ,     .     ,  (  dxxd-t'dù 

'iT:^(x,y)d<:=         '    ^-     '  • 

On  a  donc  : 

<ï>  (x,  y)d<s  z=  4>  (x ,  y)  d<s 

ou,  puisque  d<s  =  de'  : 

<^(x,y)  =  ^{x\y'), 

l'intégrale  étant  étendue  à  toutes  les  valeurs  de  [/.',  v',  p'  qui 
sont  telles  que  la  rotation  X',  a',  v',  p'  amène  M  à  l'intérieur 
de  de']  ou,  ce  qui  revient  au  même,  telles  que  la  rotation 
1,  a,  V,  p  amène  M  à  l'intérieur  de  de. 

14.  Nous  avons  ainsi  écrit  la  loi  des  probabilités  sous  une 
autre  forme,  mais  c'est  la  même  hypothèse  que  celle  que 
nous  avons  faite  quand  nous  prenions  pour  variables  X,  ix,  v,  p. 
Eu  résumé,  la  probabilité  pour  que  M  soit  à  l'intérieur  d'une 
certaine  aire  du,  et  en  même  temps  pour  que  MP  fasse  un 
angle  w  avec  MA,  est 

(lidedo), 


S 


et  <!>  est  une  constante  à  déterminer, 
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Étendons  l'intégrale  à  tous  les  éléments  de  la  sphère; 
l'angle  w  variera  de  0  à  Stt,  et  a  de  0  à  Ai:.  L'intégrale  aura 
pour  valeur 

47r*  X  271  =  Stt-*  ; 

mais  alors  la  probabilité  sera  égale  à  1.  Donc 

1 


et 


est  la  loi  des  probabilités. 

15.  Soient,  sur  la  sphère,  une  courbe  fixe  et  une  courbe 
mobile  ;  on  promet  à  un  joueur  autant  de  francs  qu'il  y  aura 
de  points  d'intersection:  quelle  est  son  espérance  mathéma- 
tique ? 

Elle  est  proportionnelle  au  produit  des  longueurs  des  deux 
courbes. 


DIXIÈME  LECOX 


1.  Si  l'on  considère  une  figure  mobile  z>  et  deux  ligures 
fixes  :p,,  521  ^^  probabilité  pour  que  o  ait  une  position  rela- 
tive donnée  par  rapport  à  z,^  est  la  même  que  la  probabilité 
pour  que  z,    ait  la  même  position  relative  par   rapport  à  cpj. 

Autrement  dit,  supposons  que  À,  a,  v,  s  définissent  la  rotation 
qui  amène  cp,  dans  une  position  o'  ;  prenons  comme  variables 
nouvelles  À',  a',  v',  p'  qui  définissent  la  rotation  qui  amène  z,.^ 
dans  cette  même  position  «'  :  nous  retrouverons  la  même 
loi  de  probabilité  et   nous  aurons  comme  plus  haut  : 


d'xd^'dà 


La  rotation  À',  ;/,  v',  p'  est  la  résultante  de  deux  autres, 
\.  a,  V,  p  et  /,  m,  n.  r  :  cette  dernière,  celle  qui  amène  ï..,  dans 
la  position  o^,  peut  être  considérée  comme  donnée,  et  le 
calcul  du  déterminant  fonctionnel  de  u.,  v,  p  par  rapport  à 
|j.',  v',  p'  est  le  même  que  dans  la  leçon  précédente. 

Cela  posé,  je  ne  conserverai  pas  les  paramètres  À,  a,  v,  p, 
dont  la  signification  géométrique  nest  pas  simple,  et  nous 
reviendrons  aux  variables  x,  i/  et  m  de  la  fin  de  la  leçon 
précédente. 
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2.  Soient,  sur  la  surface  sphérique,  M  un  point  de  la  figure 
mobile  ayant  pour  coordonnées  x,  y^  z  \  et  MP  un  arc  de 
grand  cercle  appartenant  à  la  figure  mobile  et  faisant  un 
angle  w  avec  l'arc  de  grand  cercle  MA  qui  passe  par  un 
point  fixe  A, 

1°  Quelle  est  la  probabilité  pour  que  M  soit  dans  une  aire 
rfff,  lorsque  w  varie  de  0  à  Stt  ? 

C'est  : 


dndii 


cU 


2°  Quelle  est  la  probabilité  pour  qu'un  cercle  mobile  de  la 
splière  coupe  un  cercle  fixe  ? 

Soient  P  le  pôle  du  cercle  fixe,  A  le  point  où  il  coupe  le 
tableau,  et  6  langle  POA. 


FiG.  13. 


FiG.  14. 


Soient  P',  A',   6'  les  données  analogues    pour  le    cercle 
mobile. 

Soit  cp  l'angle  POP'. 

I.a  condition  nécessaire   et   suffisante  pour  l'intersection. 
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est  que  l'on  ait  k  la  fois 

cp  <  0  -|~  0', 
cp  >  0  —  0', 

en  supposant  0  >  0'. 

Représentons  la  zone  BCB C  dans  laquelle  le  pôle  P'  du 
cercle  mobile  doit  se  trouver  ;  par  projection  sur  le  plan  du 
tableau,  les  deux  petits  cercles  qui  la  limitent  seront  figu- 
rés par  des  droites  BB',  CC;  Tang-le  POB  sera  égal  à  0  —  6\ 
et  Tangle  POC  à  0  +  0'. 

La  probabilité  cberchée  sera  proportionnelle  à  la  liauteur 
bc  de  cette  zone.  Or, 

bc  =  Ob  —  Oc  =  cos  (6  —  0')  —  cos    0  +  0') 
bc  =  :2  sinO  sinO'. 

3.  Le  problème  peut  être  plus  général.  Soient  : 
1°  n  arcs  de  grands  cercles  fixes  CpCa,--.  C„,  égaux  entre 
eux  et  de  longueur  l;  1°  n  arcs  de  grands  cercles  mobiles  ^ 
invariablement  liés  les  uns  aux  autres,  de  même  longueur 

Je  clierche  les  points  d'intersection  des  arcs  mobiles  avec 
les  arcs  fixes  et  je  promets  autant  de  francs  que  de  points 
d'intersection. 

L'espérance  mathématique  du  joueur  sera  proportionnelle 
à  nn'. 

La  probabilité  pour  que  G,'  rencontre  C,  est  la  même  que 
pour  que  Ci  rencontre  C,,  etc.,  d'après  la  démonstration 
de  tout  à  l'heure. 

Elle  reste  encore  la  même  pour  que  C,'  rencontre  Co,  etc. 

L'espérance    mathématique  sera    d'autant  de  francs   que 


122  CALCUL    DES    PROBABILITES 

l'on  peut  faire  de  combinaisons  de  l'un  des  n  premiers 
arcs  avec  l'un  des  n'  seconds.  Supposons  même  que  ces 
derniers  aient  une  longueur  l'  différente  de  l  :  l'espérance 
mathématique  sera  nn'll'. 

Si  l'on  considère  deux  lignes  brisées  formées  darcs  de 
grands  cercles,  l'espérance  mathématique  sera  encore  pro- 
portionnelle à  leurs  longueurs,  car.  si  l'un  des  éléments 
était  double,  l'espérance  mathématique  correspondante  dou- 
blerait. 

A  la  limite,  cette  conclusion  sera  encore  vraie,  et  en 
général  l'espérance  mathématique  sera  proportionnelle  aux 
longueurs  s  et  s'  des  courbes.  Elle  sera  Kss'. 

Cherchons  K. 

Supposons  deux  grands  cercles  :  leur  longueur  commune 
sera  2::,  et  ils  se  coupent  en  2  points  ;  l'espérance  mathé- 
matique sera  K  X  -iTr^,  et  comme  elle  sera  égale  à  2, 

Pour  deux  petits  cercles,  l'espérance  mathématique  sera 
r— j-    S'il   y  a   intersection,   il  y  aura  deux  points  d'inter- 

section.  Or  : 

s  :=  27r  sin  0, 
/  =  27:  sinO'. 


L  espérance  sera  : 

2:1  sin  6  X  2:1  sinO' 


=  2  sinO  sin  0'. 


C'est  ce   que  nous  avons  trouvé   plus  haut   d'une  autre 
manière. 
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4.  Supposons  sur  la  sphère  céleste  un  nombre  N  d'étoiles 
placées  au  hasard. 

Promettons  à  un  joueur  un  franc  pour  chaque  couple 
•d'étoiles  tel  que  la  dislance  angulaire  des  deux  étoiles, 
P  et  P',  soit  plus  petite  que  y.  Quelle  est  son  espérance 
mathématique? 

P'  devra  être  à  l'intérieur  d'une  certaine  zone.  La  sur- 
face de  cette  zone  est  proportionnelle  à  sin^l'Pour  v  =  tt, 

la  surface  est  celle  de  la  sphère  entière;  la  probabilité  est 
■donc  : 

V 

.2    JL 

-  =  siu- 


sur 

Y. 
9. 


sin- 1 


Comme  les  étoiles  sont  au  nombre  de  N,  elles  peuvent 

former groupes  de  2.  L  espérance  mathématique 

€st  : 

N  fN  —  11 


sm 


2  I  . 


ç)  2 

5.  Considérons  un  système  mécanique,  dont  les  équa- 
tions sont  mises  sous  la  forme  de  Ilamilton  ;  n  variables, 
a;^,  a?2--M  ^/ji  définissent  la  position  du  système;  n  variables, 
^n  2/21  •••  y  ni  définissent  les  vitesses. 

F  étant  une  fonction  donnée  qui  dépend  des  x  et  des  ?/, 
les  équations  auront  la  forme  suivante  : 

dxi  _  d¥ 
dt     ~  diji 

dyt  _        d¥ 
dt  dXi 
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On  connaît  F,  c'est-à-dire  la  loi  du  mouvement,  mais  on 
ne  connaît  pas  les  positions  initiales. 

Représentons  les  valeurs  des  variables,  au  temps  /  :=  o, 
pard?o,a;0,...  a;»  et  ?/?,3/!j,...  y,?. 

Quelle  est  la  probabilité  pour  que  ces  variables  aient  cer- 
taines valeurs  à  un  temps  t  donné  ? 

Si  je  me  donne  la  loi  de  probabilité  pour  que  les  variables 
aient  les  valeurs  initiales  ci-dessus,  le  problème  devient 
déterminé.  Je  suppose  que  l'on  se  donne  cette  loi  de  proba- 
bilité pour  les  valeurs  initiales. 

6.  Je  suppose  cette  probabilité  proportionnelle  à 
Jk  dœ^\dxl..  dx^,dy^]dijl...  di/ll, 

k  étant  une  constante. 

On  peut  supposer  qu'on  ne  sait  rien  sur  les  valeurs  ini- 
tiales, et  qu'on  sait  seulement  que  F  est  compris  entre  F^ 
et  Fo  ;  comme  F  =  const.  est  une  intégrale  des  équations  du 
mouvement  (c'est  l'intégrale  dos  forces  vives),  si  la  valeur 
initiale  de  F  est  comprise  entre  F^  et  F.^,  F  restera  com- 
prise entre  F,  et  Fj. 

L'intégrale  précédente,  étendue  à  toutes  les  valeurs  qui 
satisfont  à 

F,  <F<F„ 

sera  égale  à  1. 

Si  cette  loi  de  probabilité  est  vraie  pour  les  valeurs  ini- 
tiales des  variables^  elle  le  sera  encore  pour  les  valeurs 
finales. 

11  suffit  de  démontrer  que  le  déterminant  fonctionnel  des 
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valeurs  finales  par  rapport  aux  valeurs  initiales  est  éga\  à 
l'unité. 

Soient  x',...  y\..,  les  valeurs  des  x^...  y,...    au    temps 
t'\  X,...  y,...  leurs  valeurs  au  temps  t. 

Il  n'y  a  qu'à  établir  cette  proposition  pour   t  et  t'  très 
voisins. 

Soit  : 

t'  =  t  -{-  t. 

Je  vais,  pour  simplifier,  examiner  le  cas  de  deux  variables 
X  et  de  deux  variables  y. 

.      (^Xy  dY 

'  _      I    i^- 


et 


dY 

y-^^y^-'d^. 


Le  déterminant  fonctionnel  est  : 

d'^Y  f/-F  fPF  d?¥ 


1  + 


c/a;,c/t/,  c/^^'o^^^yi  ^^^f  dy^dy 

d'-F       ,    ,        fZ^F  d-'F  d'-F 

1  -]-  £  -: ; —  e  -; ;; —  £ 


C?J?,cZy2  C^^2^3/2  f^y2^^y<  ^2/2 

cZ^F  f^^p  ^2p  f^ap 

1  £ 


c^a:|  dx^dx.^  d.x^dy^  dx^dy^ 

d'^F  d'F  d'^F       ,  d^F 

—  e  ";~::  —  £  -; — r~     1  —  £ 


dx^dx^  dx\  dx^dy^  dx^dy^ 

Je  développe  en  négligeant  le  carré  de  £.  Tous  les  élé- 
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ments  du  déterminant  sont  infiniment  petits  du  premier  ordre,, 
sauf  les  éléments  de  la  diao:onale. 

Tous  les  termes  seront  du  second  ordre  au  moins,  sauf 
dans 


dx^diij  \         dx.4yj  \  dx^dyj  \  dx./ly 


ou 


L  ^    \dx^dyj  \\_  ^    \dx.^dyj  y 

c'est-à-dire  1,  aux  termes  près  en  e  ^. 

7.  De  tout  ce  qui  précède  il  résulte  qiiil  faut  apporter  un 
très  grand  soin  à  définir  le  choix  de  la  loi  de  probabilité  qu'on 
adopte. 

La  probabilité  pour  que  x  soit  compris  entre  x^^  et  x^  s'ex- 
prime par  une  intégrale 

/      cp  (a.-)  dx  : 

^  [x]  sera  une  fonction  sur  laquelle  nous  devrons  faire  des 
hypothèses  pour  connaître  la  loi  de  probabilité,  mais  en 
général  on  sera  conduit  à  regarder  ^  [x)  comme  continue. 

En  général,  la  probabilité  pour  que  x  satisfasse  à  une  con- 
dition donnée  dépendra  du  choix  de  <p  ;  cependant  il  n'en  est 
pas  toujours  ainsi,  et  certains  problèmes  sont  indépen- 
dants de  la  loi  de  probabilité. 

Exemple.  La  probabilité  pour  que  x  soit  incommensu- 
rable sera  toujours  égale  à  1,  quelle  que  soit  la  fonction  con- 
tinue ^  que  l'on  choisisse,  et  celle  pour  que  x  soit  commen- 
surable,  toujours  infiniment  petite. 
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8.  Autre  exemple.  Soit  une  roue  divisée  en  un  trùs 
grand  nombre  de  parties  égales,  alternativement  rouges  et 
noires  ;  imprimons-lui  une  rotation  rapide.  Lorsqu'elle  s'arrê- 
tera, une  de  ses  divisions  se  trouvera  en  regard  d'un  point 
de  repère  fixe  :  quelle  est  la  probabilité  pour  que  cette  divi- 
sion soit  rouge  ou  noire  ? 

Pour  être  complètement  résolu,  le  problème  exigerait  la 
connaissance  d'une  fonction  arbitraire;  il  dépendra  de  l'im- 
pulsion, de  la  vitesse  angulaire  initiale.  La  probabilité  pour 
que  cette  vitesse  soit  comprise  entre  w^  et  co,  est 


/ 


(p  i  (oj  c/o), 

<U0 


la  fonction  ^  étant  entièrement  inconnue. 

D'un  autre  côté,  la  roue  aura  tourné  d'un  angle  total  0.  La 
probabilité  pour  que  0  soit  compris  entre  O^  et  ()^  est 


"0 

Nous  ne  savons  rien  non  plus  sur  f{b).  Néanmoins,  la  pro- 
babilité pour  que  la  division  obtenue  soit  rouge,  sera  tou- 
jours très  voisine  de  1/2;  elle  est  donc  indépendante  de  /. 

Je  suppose  que  chaque  division  corresponde  à  un  angle  s  ; 
je  divise  l'axe  des  abscisses  en  parties  égales  à  s,  et  par  les 
points  de  division  je  mène  des  ordonnées  jusqu'à  la  ren- 
contre de  la  courbe 

Comme  les  divisions  changent  de  couleur,  je  couvre  de 
hachures  les  aires  qui  correspondent  aux  divisions  rouges, 
par  exemple. 
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La  probabilité  cherchée  sera  le  rapport  de  l'aire  couverte 
de  hachures  à  l'aire  totale. 

Quelle  que  soit  la  forme  de  la  courbe,  quand  le  nombre  des 

divisions  augmente  indéfiniment,  ce  rapport  tendra  vers  -• 


Fici.  15. 


Soit,  en  effet,  A  l'angle  maximum  dont  la  roue  peut  tour- 
ner de  telle  sorte  que  6  <  A.  Supposons  la  fonction  f  (6) 
continue  et  admettant  une  dérivée.  Admettons  de  plus  que 
cette  dérivée  ne  dépasse  pas  un  certain  maximum,  M, 

Je  divise  A  en  n  parties  égales  ;  soit  e  Tune  d'elles. 

_  A 

n 

Considérons  deux  divisions  consécutives  :  la  différence  des 
deux  aires  est  plus  petite  que  s  ((x  —  i>.'),  où  u.  etf^'  désignent 
respectivement  le  maximum  et  le  minimum  de  f  (0)  dans 
cet  intervalle.  Or  ([x  —  a')  est  plus  petit  que  2Me  :  la  diffé- 
rence des  deux  aires  est  plus  petite  que  2M£^. 

Comme  il  y  a  -  aires  couvertes  de  hachures,  il  faut  multi- 
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plier  par  -  pour  avoir  la  dilîérence  des  deux  aires  totales,  ce 

qui  donne  Me*/i  ou  MAe. 

La  dilîérence  des  deux  aires  tendra  donc  vers  zéro  avec 

£  et  la  probabilité  sera  bien  -• 

Si  on  ne  savait  rien  du  tout  sur  a,  ou  sur  f^  on  no  pour- 
rait rien  calculer:  c'est  parce  qu'on  sait  quelque  chose  que 
l'on  peut  entreprendre  le  calcul.  Mais  ici  il  nous  suffit  de 
savoir  que  /"a  une  dérivée  limitée. 

9.  Donnons  encore  un  exemple. 

Considérons  un  grand  nombre  de  planètes,  dont  les 
orbites  soient  sensiblement  circulaires.  Soient  a  le  moyen 
mouvement  de  l'une  de  ces  planètes,  h  sa  longitude  à  un 
instant  donné  pris  comme  origine.  Sa  longitude  l  au  temps  t 
sera  : 

l-.-at.-^b. 

La  probabilité  pour  que  a  et  J  satisfassent  à  certaines  con- 
ditions est 


/  3)  («,6j  dadh. 


Je  dis  qu'au  bout  d'un  temps  très  long  les  planètes  seront 
également  distribuées  dans  tous  les  signes  du  zodiaque. 

La  probabilité  pour  que  l  soit  comprise  entre  des  limites 
données  sera  donc  indépendante  de  cp. 

Cherchons  la  valeur  probable  d'une  fonction  e""'  :  si 
m  est  différent  de  0,  la  valeur  probable  tendra  vers  0  quand 
l  augmentera  indéfiniment.  Cette  valeur  probable  est  repré- 
sentée 
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par 

f  Ce'"' <«'  +  '^'  cp  (a,b)  dadh. 

Intégrons  par  parties. 

1 : a>db  —  /  /  — ^ V  dadb. 

f       zmt      ^  J  J       imt      da 

Si  nous  supposons  seulement  cp  continue,  les  deux  termes 
ci  dessus  tendront  vers  zéro. 

Je  demande  la  valeur  probable  d'une  fonction  périodique 
quelconque,  f{l).  La  formule  de  Fouriernous  donne  : 

Chacun  des  termes  de  cette  série  aura  pour  valeur  pro- 
bable 0,  sauf  le  terme  constant  A,,.  La  valeur  probable 
de  f[l)  sera  donc  : 


Supposons  que  l'on  ait  : 

0  <  /o<^  <  27r; 

la  probabilité  pour  que  l  soit  compris  entre  I^^  et  I^  est  : 

1  f'^  „        l,  —h 


2Ju  27: 


C'est  la  valeur  probable  d'une  fonction  f  (l)  égale  à  1  si  T 
est  compris  entre  Iq  et  /^  et  à  0  dans  le  cas  contraire. 

Si  t  est  quelconque,  quel  que  soit  cp,  la  probabilité  sera 
sensiblement  proportionnelle  à  If-l^  ;  la  distribution  des  pla- 
nètes sera  uniforme 
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1.  Nous  allons  aborder  les  problèmes  connus  sous  le 
nom  de  probabilités  des  causes. 

Les  problèmes  que  nous  avons  traités  rentraient  dans 
renoncé  suivant:  étant  donné  que  telle  cause  est  mise  en 
jeu,  quelle  est  la  probabilité  que  tel  effet  en  résultera. 

Les  problèmes  inverses  sont  :  étant  donné  que  tel  effet 
s'est  produit,  quelle  est  la  probabilité  que  telle  cause  a  été 
mise  en  jeu. 

Le  type  de  ces  problèmes  est  celui  de  deux  urnes  dont  la 
première  contient  beaucoup  plus  de  boules  blanches  que 
l'autre  :  on  a  tiré  une  boule  blanche,  mais  on  ne  sait  pas  de 
quelle  urne  ;  il  y  a  plus  de  raisons  de  croire  la  boule  sortie 
de  la  première  urne  que  de  la  seconde. 

Pour  donner  une  définition,  il  faut  l'aire  une  espèce  de 
convention,  comme  au  début  de  toute  question  de  probabi- 
lité. 

Quand  on  compare  le  nombre  des  cas  possibles  au  nombre 
des  cas  favorables,  l'on  doit  avoir  soin  que  tous  les  cas  soient 
également  probables.  La  convention  qui  repose  sur  des  cas 
regardés  comme  également  probables  contiendra  toujours 
un  très  large  degré  d'arbitraire. 

D'un  jeu  de  .32  cartes,  on  tire  une  carte  :  on  sait  que  c'est 
une  figure  ;  quelle  est  la  probabilité  que  l'on  a  tiré  un  roi? 
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Avant    Févénement,   la    probabilité   était  le    rapport    du 

4 
nombre  des  rois  au  nombre  total  des  cas  possibles,  soit  — 

1 

ou^- 

Après  l'événement,  le  nombre  des  cas  favorables  est  tou- 
jours 4;  le  nombre  des  cas  possibles  est  diminué,  c'est  celui 

4         \ 

des  figures,  soit  12.  La  probabilité  est  devenue  —  ou  -  ;    elle 

a  augmenté. 

2.  Formule  de  Bayes.  —  n  causes  différentes  peuvent  être 
mises  en  jeu,  C^,  Ca,  ...  C„  ;  la  probabilité  pour  que  la  cause 
C/,  si  elle  est  mise  en  jen,  produise  l'événement  A  est  p,. 

Si  nous  savions  que  C,  est  en  jeu,  nous  pourrions  affirmer 
que  la  probabilité  de  A  estp,. 

Il  faut  supposer  que  deux  causes  ne  peuvent  être  mises  en 
jeu  simultanément. 

Avant  l'événement,  chacune  de  ces  causes  avait  un^  pro- 
babilité a  priori  que  je  suppose  donnée  :  la  probabilité  que 
la  cause  C,-  soit  mise  en  jeu  était  ct,-. 

L'événement  A  a  eu  lieu  :  quelle  est  la  probabilité  que  ce 
soit  la  cause  C,  qui  l'ait  produit  ? 

Énumérons  les  cas  possibles  et  les  cas  favorables,  et,  pour 
fixer  les  idées,  considérons  un  exemple  particulier. 

M  urnes  contiennent  chacune  Q  boules;  il  y  a  MQ  boules, 
soit  MQ  cas  possibles,  que  je  suppose  également  probables. 

Les  urnes  sont  réparties  en  catégories  C,,  Cj...,  C„. 

Les  urnes  de  la  catégorie  C,  seront  au  nombre  de  ct<M; 
de  la  catégorie  Ca,  au  nombre  de  is.JA; ...  de  la  catégorie  C„, 
au  nombre  de  cj^M. 
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La  probabilité  pour  que  la  cause  C„  soit  en  jeu  sera  : 

cî„M 


M 


CTa- 


Dans  les  urnes,  les  boules  sont  noires  ou  blanches.  L'évé- 
nement A  est,  par  exemple,  la  sortie  d'une  boule  blanche.  La 
probabilité  pour  tirer  une  boule  blanche  de  la  première 
catégorie  sera  p, . 

Dans  la  catégorie  C,,  il  y  aura  j),Q  boules  blanches  ;  dans 
la  catégorie  C2,  il  y  en  aura  PoQ  ••••  ^^^^  ^^  catégorie  C„,  il 
y  en  aura  PnQ.- 

On  a  tiré  une  boule  blanche  :  on  demande  la  probabilité 
pour  que  l'urne  qu'on  a  choisie  appartienne  à  la  catégorie  C,-. 

Le  nombre  des  cas  favorables  est  le  nombre  des  boules 
blanches  de  la  catégorie  C,-,  soit  cT,p,MQ. 

Le  nombre  total  des  cas  possibles  est  celui  des  boules 
blanches  : 

nT,p,MQ  +  us^Pi^lQ  +  •••  +  nT„,"«MQ 

Le  rapport  de  ces  deux  nombres  est,  par  définition,  la 
probabilité  cherchée  : 

r:î,pi 


^iPi  +  ^2^2  H-  •••  "h  ^"P" 


3.  On  peut  dire  encore  : 

La  probabilité  que  la  cause  C,  ait  été  mise  en  jeu,  puis 
que,  mise  en  jeu,  elle  ait  produit  l'événement  A,  est  une 
probabilité  composée. 

D'abord  la  cause  C,  doit  être  en  jeu,  et  sa  probabilité  a 
priori  est  cr,  ;  ensuite,  mise  en  jeu,-  elle  donne  à  A  la  proba- 
bilité Pi.  La  probabilité  composée  est  CT,p,. 
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Mais  la  question  se  pose  autrement. 

Il  faut  que  l'événement  se  soit  produit,  et  ensuite  qu'il 
doive  être  attribué  à  la  cause  Cj.  C'est  encore  une  probabi- 
lité composée. 

La  probabilité  pour  qu'il  se  produise  est  : 

nj,p,  +  UoPa  -f  ...  -f-  nj„p„; 

la  probabilité  [si  l'on  sait  qu'if  s'est  produit)  pour  qu'il  soit 
dû  à  la  cause  C,  étant  x,  la  probabilité  composée  pour  que 
l'événement  se  soit  produit  et  soit  dû  à  la  cause  C,  sera  donc 

d'où  : 


^iPl    +  ^^2^2   +   •••   +  ^'iPn 


4.  A  l'écarté,  votre  adversaire  donne  et  tourne  le  roi  ; 
quelle  est  la  probabilité  que  ce  soit  un  grec  ? 

Soient  cT^  la  probabilité  pour  qu'il  ne  soit  pas  grec;  Wg» 
pour  qu'il  le  soit.  Dans  le  premier  cas,  la  probabilité  pour 

1 

qu'il  tourne  le  roi  est-;  dans  le  second,  elle  est  1.  La  pro- 
o 

habilité  a  posteriori  qu'on  a  affaire  à  un  grec  est  : 


8  ^""^ 


Si  l'on  suppose  cr,  =  ci, ,  dans  l'ignorance  où  l'on  est  de 

l'honnêteté  de  son  adversaire,  cette  probabilité  est  de  -  •    Elle 
serait  donc  énorme. 
Fort  heureusement  il  est  permis  en  général  de  supposer  a 
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priori  : 

5.  Dans  une  urne,  Jonl  la  composition  est  inconnue,  il  y 
a  N  boules;  nous  elTectuons  a  tirages,  en  remettant  chaque 
fois  la  boule  tirée,  et  nous  ne  tirons  que  des  boules  blanches. 
Quelle  est  la  probabilité  pour  que  l'urne  contienne  n  boules 
blanches  ? 

Soit  cy,j  la  probabilité  a  priori  jxjur  qu'il  y  ait  n  blanches; 
■et  soit  j)„  la  probabilité  pour  qu'on  amène  a  blanches. 


Pn  = 


n\\>- 


Après  les  tirages,  la  probabilité  pour  que  l'urne  renferme 
n  blanches  est  donnée  par  la  formule,  et,  après  la  suppres- 

-j  )  5  commun  aux  deux  termes  de  la  frac- 
tion, elle  est  égale  à  : 


n,  l!^- -f- rr.-i;^-  +  ...  -f- rTv-X^- 


6.  Il  faut  connaître  a  priori  n,,  w.^...  ctn,  sur  lescjuelles  on 
peut  faire  plusieurs  hypothèses. 

Supposons,  par  exemple,  que  toutes  les  compositions  de 
l'urne   sont  également   probables,    c'est-à-dire    tous   les    cj 

ég-aux.  Chacun  d'eux  vaudra  r; — \ — .  •  car  il  v  a  N  -|-  1   com- 

positions  possibles  de  lurne,  en  y  comprenant  celle  où  il 
n'v  a  aucune  boule  blanche.  La  fraction  précédente  se  réduit 


la_|_2|J-  +  ...   -j-N!^ 
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Supposons,  en  second  lieu,  que  l'on  ait  placé  successive- 
ment les  N  boules  dans  l'urne,  les  unes  blanches  et  les 
autres  noires,  en  laissant  au  sort  chaque  fois  le  soin  de 
décider  la  couleur. 

La  probabilité  que  l'on  mettra  une  blanche  sera  chaque 

.1 

fois  -'  et  la  probabilité  que  finalement,  sur  N  boules,  l'urne 

en  contiendra  n  blanches  sera  évaluée  par  la  formule  : 

m  ! 
a  !  7«  —  a  ! 

où  l'on  fera  : 


m  =  N,       a  =  «, 

ce  qui  donne  : 

N! 


1  . 

9    5 


î«  !  N  —  w  !  \  2 


Ainsi  la  probabilité  a  priori  nT„  pour  qu'il  y  ait  n  blanches 
sera  proportionnelle  à  un  coefficient  du  binôme,  et,  dans 
l'expression  de  la  probabilité  a  posteriori  pour  qu'il  y  ait  n 
blanches,  nous  n'aurons  qu'à  faire  les  rj  égaux  à  ces  divers 
coefficients. 

N! 


77„ 


N 


7.  Le  résultat  sera  très  différent  du  précédent. 
Soit  N  très  grand  ; 

sera  un  polynôme  de  degré  [j^  4"  1  ^n  N,  que  je  puis  réduire  à 
son  terme  de  degré  le  plus  élevé,  — — r* 
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La  probabilité  dans  la  première  hypothèse  deviendra 
ainsi  : 

w!'-  ig  -t-   1) 

et,  pour  u.  =:  2,  par  exemple,  elle  vaudra  -^  • 

Dans  la  seconde  hypothèse,  évaluons  d'abord  vs.,n'^-,  pour 
la  même  valeur  2  de  a. 

Evaluons  ensuite  le  dénominateur  : 

rô,ll^-f-njo2S^  +  ...  -f  cjnN!^. 
Pour  cela  considérons  l'expression  : 

1  -f-  e^cT,  -j-  e-^nio  +  •■•  "h  e^^'ris, 
qui  n'est  autre  que  le  développement  de  : 

(1  +  e^}^'. 
Je  difîérentie  deux  fois  par  rapport  à  x  : 

l^^CT,  +  22e2a:^^  +  ...  +  N^e^'-^r^N- 

Il  suffit  de  faire  a;  =:  0  pour  retrouver  le  dénominateur 
que  nous  voulons  connaître  quand  a  =  2. 

Ce  dénominateur  est  donc  le  double  du  coefficient  de  x- 
dans  le  développement  de  (i  +  e^j^  suivant  les  puissances 
de  j:  :  or,  en  nous  arrêtant  aux  termes  en  x-, 

(1  +  ,x)x  =  (^2  +  x  +  f  )'  ^  2^  (l  +  f  +  ff^ 
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c'est-à-dire  : 

Le  terme  du  degré  le  plus  élevé  en  N  à  l'intérieur  de  la 

parenthèse  est  —  j?^.  Le  dénominateur  dont  nous  cherchons 

W 
la  valeur  est  donc  approximativement  le   double  de  2"^  —  j 

o 

•c'est-à-dire  vaut  'î>^-~  ]\3. 

Ainsi,  dans  la  seconde  hypothèse,  la  probabilité  pour  que 
l'urne  contienne  n  boules  blanches  est  : 

N!         ^2      1 


n!  N  —  «!  N-2^--' 

elle  est  beaucoup  plus  petite  que  dans  la  première  hypothèse. 
En  effet,  comme  on  l'a  vu  à  propos  du  théorème  de  Ber- 
nouilli, 

N!  1 


w  !  N  —  n  !  2^ 


«st  très  petit,  sauf  quand  net  N  —  n  sont  sensiblement  égaux 

,    ,.       ...  1 

-a  p  et  ^,  c  est-a-dire  ici  a  -• 

8.  Deux  joueurs  d'échecs  ont  joué  n  -\-  m  parties  :  le  pre- 
mier en  a  gagné  n,  le  second  m.  Si  n  >  ?«,  on  doit  supposer 
le  premier  plus  fort. 

Si  une  nouvelle  partie  s'engage,  le  premier  aura  plus  de 
chances  de  la  gagner. 

Quelqu'un  de  bien  informé  pourra  se  représenter  par  p  la 
probabilité  pour  que  ce  joueur  gagne.  Mais,  pour  moi  qui  ' 
n'ai  jamais  vu  jouer  cet  individu,  je  ne  connais  pas  p;  je  vais 
chercher  à  m'en  faire  une  idée. 
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La  probabilité  pour  que  p  soit  compris  entre  p^  et  p,  se 
représente  par  : 


où  la  fonction  f(p)  est  inconnue. 

La  probabilité  pour  que  p  soit  compris  entre  p  et  p  -f~  '^^P 
sera  a  priori  f[p]  dp;  c'est  elle  qui  correspond  à  cr,. 

A  la  probabilité  p,-  correspond  : 

y     ,    P"q"'. 

La  cause  considérée  est  en  effet  que  la  probabilité  de 
gagner  soit  p  pour  le  premier  joueur. 

La  probabilité  que  ce  premier  joueur  gagne  n  parties,  p 
étant  sa  probabilité  de  gagner  à  chacune  des  n  -f-  m  parties, 
sera 

J   ,    p"q"'. 

Quelle  est  la  probabilité  a  posteriori  que  p  est  compris 
entre  p  et  p  -\-  dp'î 

Ici  C7/P/,  en  remplaçant  q  par  1  —  p,  est  égal  à  : 

r{i-p'-"-^^^r[p'cip. 

La  somme  des  rsipi  sera  : 


fi    —I—  vy)  ' 

p"^^-pri^i^f{p)dp-^ 


0 


cette  intégrale  doit  être  prise  de  0  à  1,  car  la  probabilité  p 
€st  comprise  certainement  entre  ces  limites. 
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On  fait  généralement  l'hypothèse 

r{p)  =  ^. 

faute  d'autres  renseignements. 

L'intégrale  s'évalue  alors  simplement  : 


n  -\-  ml 


!   J  0 


L'on  est  ramené  à  l'intégrale  eulérienne  de  première 
espèce  : 

B  [n  -f  1,  m  +   1    =    — — ^ \^        , 

les  r  sont  ici  des  factorielles,  et  cette  expression  n'est  autre 
que  : 

n  [  m^ 

n  -\-  m  -{-  l\ 

'  Ainsi  l'intégrale  qui  représentait  la  somme  des  zs,-  pi  est 

1 

simplement  égale  à  — -r- -— ;  >  et  la  probabilité  a  posteriori 

pour  que  p  soit  compris  entre  p  ei  p  -\~  dp  est: 

,  ,    ,          n  A-  m  -\-  i\        ,.  ,      , 

"^  ^^^  ^^  "^ '^iÂm\ ^    ^    ~  ^^     ^' 

9.  Quelle  va  être  la  probabilité  pour  que  ce  joueur  gagne 
la  partie  suivante  ? 

Cette  probabilité  s'obtient  facilement.  La  probabilité  pour 
que  p  soit  compris  entre  p  ^i  p  -\-  dp  est  cp  (p)  dp  ;  la  proba- 
bilité, lorsqu'il  en  est  ainsi,  de  gagner  la  partie  suivante 
pour  le  joueur  est  p  ;  en  vertu  de  la  probabilité  composée,  la 
réunion  de  ces  deux  conditions  a  pour  probabilité  pi^  (p)  dp. 
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On  intégrera  cet  élément  de  0  à  1,  d'où 


J^P?  (P)  dp- 
Si  l'on  remplace  :j.  (jjj  par  sa  valeur  : 

ni  ml         J 0 
C'est  encore  une  intégrale  eulérienne,  et  l'on  arrive  k  : 


n  -f  m  +  1  !    n-\-i\  oïl 
n  !  ??i  !       n  -\-  m  -\-  ^\ 


ou  : 

n-f-  1 


n  -\-  m  -\-  ^ 


Si   j'avais  appliqué   le  même  raisonnement   à   un  jeu   de 
hasard,  je  n'aurais  pas  eu  le  droit  de  supposer  /"(p.  =  Y.  A 

priori,  en  effet,  p  devait  égaler -•  Donc  /  [p]   devait    être 

infini  pour  yj  =  -• 
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1.  Représentons  par  N  le  nombre  total  des  petites 
planètes  ;  parmi  elles,  un  certain  nombre  M  sont  connues. 
Dans  une  année,  on  en  observe  n  parmi  lesquelles  ?n  planètes 
connues. 

On  demande  la  valeur  probable  de  N. 

La  valeur  de  N  ne   peut  différer  beaucoup  de  —^  »   mais 

cette  évaluation  au  jugé  ne  suffit  pas  :  il  faut  s'occuper  de 
l'écart  probable  entre  le  nombre  véritable  et  le  nombre 
probable. 

Voici  comment  nous  procéderons  : 

En  premier  lieu,  nous  supposerons  connue  la  probabilité 
pour  que,  pendant  l'année  d'observation,  une  planète  exis- 
tante ait  été  observée,  soitp  cette  probabilité:  nous  admet- 
trons qu'elle  est  la  même  pour  les  planètes  connues  et 
inconnues. 

Comme  nous  avons  observé  n  planètes,  la  valeur  probable 

n 
de  N  semble  au  premier  abord  devoir  être  ég-ale  à  -  ;  mais 

r  ^  p 

il  n'est  pas  possible  que  cette  valeur  soit  tout  à  fait  exacte  : 
les  nombres  1,  2,  ...,  N  ont  des  probabilités  propres  que 
j'appelle  cy<,  tjs^.,  ...,  ctn,  et  la  valeur  probable  de  N  sera  : 
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Si  Ton  suppose  p  doniu',  et  tous  les  nombres  1,  2,   ..  ,  N 

également  probables,  on  arrivera,  comme  nous  le  montrerons, 

à  "  "^~  '^  pour  la  valeur  probable  de  N. 
P 
Ce   premier  point  résolu,  nous  nous  poserons  un    autre 

problème  ;  nous  avons  supposé  p  connu,  nous  ne  le  sup- 
poserons plus,  et  nous  déterminerons  ensuite  la  valeur 
probable  de  N  en  fonction  de  7n  et  M,  ce  qui  nous  donnera 

un  résultattrès  voisin  de  —  comme  nous  l'avons  prévu  plus 
haut, 

2.  J'appelle  donc  cjn  la  probabilité  a  pnore  pour  qu'il  y  ait 
N  planètes  ;  ^n  la  probabilité  pour  que,  s'il  y  a  ainsi  N  pla- 
nètes, on  en  observe  n  dans  l'année. 

La  probabilité  a  posteriori  pour  qu'il  y  ait  en  tout  N 
planètes  est  une  probabilité  de  cause;  elle  s'exprime  par: 

ctnPn  , 
SctnPn 

Comme  première  hypotlièse  sur  les  rj,  supposons-les  tous 
égaux  ;  la  formule  précédente  se  réduit  à  : 

Pour  calculer  Pn,  appliquons  le  théorème  des  épreuves 
répétées.  La  probabilité  que,  sur  N  planètes,  on  en  obser- 
vera n  dans  l'année  est  • 


N' 


P^  =  n\^-n\^'^ 


»j^N  —  n 
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p  étant  la  probabilité  pour  qu'une  planète,  si  elle  existe,  soit 
observée  ;  q  la  probabilité  pour  qu'elle  ne  le  soit  pas. 

n  est  une  valeur  constante  :  c'est  la  plus  petite  que  puisse 
prendre  N.  Faisons  croître  N  indéfiniment  : 

w  4-  1  ,    (n  4-  1)  (w  4-  2) 

=  p"  (1  —  (^)-("  +  ')  =  F  (p,  ^). 

Si  j'introduis  maintenant  la  relation  p  =  1  —  q  : 

1 

Avec  l'hypothèse  faite  sur  les  ni,  la  probabilité  pour  qu'il 
y  ait  N  planètes  est  donc  pp^. 

3.  La  valeur  probable  de  N  est: 

SNp__N 

Il  est  un  peu  plus  simple  de  calculer  la  valeur  probable  de 
N  —  w,  soit  : 

S  (N  —  n)  Pn 

SPN 

N! 


Posons 


!  N  —  n  !  ' 


alors  : 

SpN  =  SAp"g^-" 
S  (N  —  r?)  Pn  =  SAp"  (N  —  n)  q^-'\ 

Pour  évaluer  le  second  membre   il   suffît  de  différentier 
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F(p,  q)  par  rappurt  à  </,  et  de  multiplier  le  résultat  par  q  : 

dF 

faisons  après  cette  différentiation  1  —  q  =z  p.ll  reste  : 
{n-^i)q. 

En  vertu  d'une  précédente  démonstration,  cotte  expression 

1 

est  égale  à  SAp"  (N  —  n)  q^~'\  Comme  d'autre  part  S^n  =  -» 

la  valeur  probable  do  N  —  n  est  : 

{n  +  i)  g 


P-         _  [n  +  ^)  7 
i  V 

P 

i*ar  suite,  la  valeur  probable  de  N  est  : 

n 
Cette  quantité  diffère  très  peu  do  -'  comme  il  était  prévu. 

En  effet  : 

p  p 

4.  Considérons  maintenant  la  valeur  de  p  comme  incon- 
nue ;  je  supposerai  qu'on  veuille  connaître  quelle  est  la  pro- 
babilité pour  quep  soit  compris  entre  p  et  p  -|-  dp. 

Ici,  la  probabilité  a  priori.,  zôï,  pour  qu'il  en  soit  ainsi, 
sera  : 

cT/  =  r{p)  dp,    . 

où  /  (p)  est  une  fonction  inconnue  de  p. 
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Pi  sera  la  probabilité  pour  que,  si  p  a  une  valeur  déter- 
minée, l'événement  observé  se  produise,  c'est-à-dire  pour 
que,  sur  M  planètes,  on  en  observe  m. 

M' 

Toutes  les  valeurs  possibles  de  p  sont  comprises  entre  0 
et  1.  On  a  donc: 

M' 
T3,pi  7n]  M  —  m!  -^   ^  _ 


SC7,-P/  _    _  M_ 


m\  M  —  m  ! 


C  p"hf~'"f[j))  dp 
'  0 


Quel  est  le  nombre  probable  pour  N?  Nous  multiplierons 

le  numérateur  par  ■  ?  et  nous  intégrerons  do  0  àl.  Cette 

^  p 

valeur  probable  N  est  égale  à  : 


N=^ 


P 


f  p"'(/^-"'f{p)  dp 

'J  0 


Ce  résultat  dépend  de  f  [p)  ;  supposons  cette  fonction  égale 

1                     ■  '^  -\-  Q         n  -\-  l 
al,  et  remplaçons  aussi par —  1 . 

I     pmçM-»i  ! dp  —   \    p"'q^^—"'dp 

I  P  «^  0 


N  =  -^ 


/    p'"q^-'"dp 
^  0 

_|_  Y)    {    p"'-^q^'-"'dp 

7-, *• 
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Posons  : 

N  =  (n  4-  1)  J  —  1. 

J  est  le   rapport  de  deux  intégrales  qui  sont  encore  des 
intégrales  eulériennes. 

r  (m)  r  (M  —  m  -f-  i  ) 

"'  r  (M  4-  i)  _     r  (M  +  2)  r  (m) 

~  r  (m  4- 1)  r  (M  —  m  +  ij  ~~  r  (M  +  i)  r  {m  +  1)' 

r  (M  +  2) 

in 
et  par  conséquent  : 

-^  0^+l)(M  +  i)  _  ^ 


Mn' 
Cette  valeur  est  très  voisine  de  — )  ainsi  que  nous  l'avons 

m  ^ 

annoncé. 

THÉORIE    DES    ERREURS.    —  5.    Je    suppose   (pu) 
l'on  ait  effectué  différentes  mesures 


d'une  même  grandeur  :  quelle  est  la  probabilité  pour  que  la 
véritable  valeur  soit  comprise  entre  ^  et  ^  -f"  ^^  '* 

Il  faut  introduire  une  loi  des  erreurs.  Je  suppose  que  la 
véritable  valeur  de  la  grandeur  à  mesurer  soit  z  ;  quelle  est 
la  probabilité  pour  que  le  résultat  de  l'observation  soit  com- 
pris entre  Xj^  etx^  -\-  dxj^'?  Je  pourrai  dans  tous  les  cas  re- 
présenter cette  probabilité  par 

dXf(^  (a?,,  z). 
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Cette  loi  des  erreurs  étant  admise  par  convention,  quelle  est 
la  probabilité  pour  que  z  soit  compris  entre  z  qI  z  -\-  dz'^ 

C'est  un  problème  de  probabilité  des  causes,  et  nous 
allons  calculer  : 

Toi  est  la  proljabilité  a  'priori  pour  que  z  soit  compris 
entre  z  et  ^  -|-  '^^  !  cette  probabilité  sera  représentée  par  : 

^i  =  '\  (^)  dz, 

tj;   étant  une  fonction  qui   dépendra  de  ce   que  nous   savons 
sur  z. 

Pi  est  la  probabilité  pour  que,  à  supposer  que  la  quantité 
observée  soit  2-,  les  observations  aient  donné  des  rés-ultats 
compris  entre  : 

ce  t    GL  CO  t    *H      CtOG  t  ^       ^*2  ^^  ^^  xXOdy^        ..>   OGji   Gt  CG^i    '\'  '  (XOOfi, 

La  probabilité  respective  de  ces  événements  est  : 

c/^jCp  (a;^,  z\    dx^^Sf  (a;^,  ^),  ...  dœ„^  {oc„^z). 

Pi  est  la  probabilité  pour  que  tous  ces  événements  se  soient 
produits  à  la  fois  ;  comme  ces  événements  sont  indépendants, 
c'est  une  probabilité  composée  : 

Pi  z=  dûo^dx.2  ...  dx„^  (-r,,  z)  cp  (a;,!  -s")  •••  »  (a;„,  z). 

La  probabilité  a  posteriori  cherchée  a  pour    numérateur  : 

dzdx^dx.^  ...  dxn'\  [z]  cp  (a?,,  z)  cp  (a?^,  ^)  ■■■  ?  [^n^  -S").' 

Pour  obtenir  le  dénominateur  ^rsiPt.,  il  faut  intégrer  cette 
expression  par  rapport  à  z  seulement.    Dans  le    quotient. 
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dx^,  doo.y,...  dùc„  sont  dos  constantes  (jui  disparaîtront,  et  il 
restera  pour  la  probabilité  : 

dz<\  [z]  (0  {x^,  z)  9  [x.^,  -3-)  ■■■  9  {x„,  z) 
/        dz^\  [z]  o  (x^,  z)  (f  [x.^,  z)  ...  û  {x„,  z) 

6.  Cela  ne  nous  apprendrait  pas  j^rand'chose  si  nous 
n'avions  aucune  donnée  sur  cp  et  il/.  On  a  donc  fait  une  hypo- 
thèse sur  cp,  et  cette  hypothèse  a  été  appelée  loi  des 
erreurs. 

Elle  ne  s'obtient  pas  par  des  déductions  rigoureuses  ; 
plus  d'une  démonstration  qu'on  a  voulu  en  donner  est  gros- 
sière, entre  autres  celle  qui  s'appuie  sur  l'affirmation  que  la 
probabilité  des  écarts  est  proportionnelle  aux  écarts.  Tout 
le  monde  y  croit  cependant,  me  disait  un  jour  ]M.  Lippmann, 
car  les  expérimentateurs  s'imaginent  que  c'est  un  théorème 
de  mathématiques,  et  les  mathématiciens  que  c'est  un  fait 
expérimental. 

Voici  comment  Gauss  y  est  arrivé. 

Lorsque  nous  cherchons  la  meilleure  valeur  à  donner  à  ^, 
nous  n'avons  pas  d'autre  ressource  que  de  prendre  la 
moyenne  entre  Xf,  x.2,...  x,i,  en  l'absence  de  toute  considé- 
ration qui  justifierait  un  autre  clioix.  Il  faut  donc  que  la 
loi  des  erreurs  s'adapte  à  cette  façon  d'opérer.  Gauss 
cherche  quelle  doit  être  z,  pour  que  la  valeur  la  plus  probable 
soit  la  valeur  'moyenne. 

7.  Si  dz  est  constant,  la  probabilité  pour  que  z  soit  com- 
pris dans  l'intervalle  c/s-  est: 

^  (-2-)  Cp  (.^^,  3-)-C5  (a?2)    ^)---   'f  [^n:  z)  dz. 
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La  valeur  la  plus  probable  sera  celle  pour  laquelle  cette 
fonction  sera  maximum.  Supposons  ce  maximum  atteint 
quand ^  est  la  moyenne. 

flauss   a  d'abord  égalé  la  fonction  <|^  à  1,  puis  il  a  admis 

que  (f  (ix;, ,  z)  était  de  la  forme  cp  (,j  —  x^). 
Quelle  doit  être  alors  la  fonction  cp  pour  que  : 

cp  (^  —  .v^)  ^  {z  —  x^)...  cil'  {z  —  x„) 

soit  maximum  avec  cette  valeur  de  -3r  ? 

Egalons  à  zéro  la  dérivée  logarithmique  de  l'expression 
précédente  par  rapport  à  z  : 

<ù'  {z  ~  x^)        cp^(^  —  x.;^)  I    iK^^L^_Q_ 

c^  (z  —  œ^)    '    C6  (3-  —  x^)  "'■■■"'"  cp  (3-  —  x„) 


Je  pose 


^7;  ~  !'!  =  F  (-.)• 


L'équation  à  vérifier  devient  : 

F(a^,)  +  F(^-,)  +  ...+F(.T„)  =  o. 

Cette  condition  devra  être  réalisée  toutes  les  fois  que 

d?,  -\-  X.,  -\~  ...  -\-  x„  =  nz. 

Je  donne  à  a;^ ,  a;^ ,  •  •  ■  ^«  des  accroissements  dx^ ,  dx^ , . . .  dx^i  ; 
z  restant  constant,  la  somme  des  x  doit  rester  constante  et 
on  doit  avoir  : 

F'  (icj  dx^  -\-  F  (^'2)  dx^...  -|-  F'  (a;„)  dx^  =  o, 
dx^  ■\-  dx^  -j-  ••■  ~f"  d^n  =  0. 

Ces  deux  équations  doivent  être  identiques,  d'où  : 

W{x,)  =  Y{x^)  =  ...  =  F'(^„), 
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c'est-à-dire  que  F'  (27/1  est  une  constante  que  je   représente 
par  —  a. 

F  [x^]  ^  a  (z  —  x^)  -\-  ^'. 
et  : 

Lcp  (z  —  x^)  = ^—^-^  -|-  *  (2  —  ^1)  -)-  Ç- 

Déterminons  les  constantes  a,  b,  c. 

F  {x^)  -}-  F  (a;.,)  +  ...  +  F  {x„\  =  ^a  [z  —  x^)  -\-  nb  =  o, 
x^  -\-  x^  -{-..■  -\-  x„  —  nz  =^  —  ^  [z  —  x^)  :=  o. 

Comme  ces  deux  é([uations  doivent  être  identiques,  on  a  : 

*  =  0, 
et  l'on  peut  écrire  : 

a{z  —  X\)" 

'jf  {z  —  x^)  =  e^e       -       ; 

c  se  détermine  par  la  condition  : 

/+  00 
31  (s-  —  x^)  dx^   =  1. 
-5p 


En  posant 


on  trouve 


a  =  2A 
—  x^  =  y. 


?w  =  \/; 


e-^v-- 


8.  M.  Bertrand  présente  les  objections  suivantes. 

La  l'onction  o  a  été  prise  sous  la  forme  [z  — a;,),  tandis 
qu'en  réalité  elle  devrait  être  o  (^,  x^.)  De  plus,  on  a  fait 
•]/  [z)  =  1,  et  Ton  ne  peut  l'aftirmer  a  priori. 

Autre  objection  :  La  moyenne  est-elle  la  valeur  la  'plus 
probable  ou  la  valeur  probable?  Ce  n'est  pas  la  même  chose. 
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Supposons  qu'une  certaine  grandeur  x  puisse  prendre 
pour  valeur  : 

1,  2,...,  w  —  1  ou  w, 

et  que  chacune  de  ces  valeurs  ait  pour  probabilité  : 
de  telle  sorte  que  : 

La  valeur  probable  de  x  sera  par  définition  : 

^  =  Pi  H-  2p2  +  ...  +  np„. 

La  valeur  la  plus  probable  de  x  sera  celle  qui  correspond 
au  plus  grand  des  nombres  p. 

Dans  le  cas  du  problème  des  erreurs,  la  valeur  probable 
de  z  est  donc  représentée  par  le  rapport  : 


/+00 
dz  Z'])  [z)  ^  [x^,  z)  cp  [x.^,  .?)...  cp  [xn. 


dz  ']/  {z)  cp  [Xf,  z)  tp  [x.j^,  z)  ...  cp  {x„,  z) 


M.  Bertrand  dit  que  Gauss  aurait  dû  chercher,  non  pas  la 
condition  pour  que  la  moyenne  soit  la  valeur  la  plus  pro- 
bable de  z,  mais  la  condition  pour  que  la  moyenne  soit  la 
valeur  probable  de  z. 

9.  On  peut  chercher  à  s'affranchir  des  hypothèses  que 
nous  avons  faites,  à  savoir  que  cp  {x^^  z)  était  de  la  forme 
cp  [z  —  Xf)  et  que  <]>  [z]  était  égale  à  1  ;  on  peut  se  demander 
quelle  forme   on   pouvait  donner  à  ces  deux  fonctions   pour 
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que  la  moyenne  arithmétique  de  a?,,  a?.,,...  Xn  fût  bien  la  va- 
leur la  plus  probable  de  z. 

En  d'autres  termes,  cette  moyenne  arithmétique,  comme 
nous  l'avons  déjà  dit,  doit  rendre  maximum  : 

J;  [z)  c&  {x^,  z)  ^  [x.^,  z)  ...  cp  (a;„,  z). 

Quand  il  y  a  maximum,  la  dérivée  logarithmique  est 
nulle;  c'est-à-dire  que  si  Ion  pose  : 

©'.  (x,,  z)        j^  ,  , 

'h(z)  '' 

on  doit  avoir  : 

F  {x,,  z)  +  F  {x.,,  z)  +  ...  +  F  {x,„  z)  +  y  =  o. 

Cette  égalité  doit  être  satisfaite  par  la  valeur  de  z  que 
définit  l'équation  : 

x^  -{-  X. 2  -{-...  -\-  x„  =  nz. 

Je  donne  à  07^,  x.^,....,x,t  des  accroissements  dx^.,  dx^.,  .••, 
dxr,.  Je  suppose  que  z  ne  change  pas  et  que  la  dernière 
égalité  continue  à  être  satisfaite  ;  /  est  alors  une  constante,  et  : 

dV  {x^)    .        .    d¥  [x^    j        .  .    d¥  {x„) 

dx^  -\-  dx^  -|~  •••  ~h  ^^"  ^=  O- 

Ceci  ne  peut  avoir  lieu  que  si  : 

.  d¥  [x,]       d¥  ix.^      -  r/F  ix,) 

dx^  dx^  '"  dx„ 
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Donc  : 

—  —A' 

où  A'  est  fonction  de  z  seulement  ;  et  : 

F  =  A'x^  -h  B', 

B'  étant  aussi  fonction  do  z  seulement. 
La  condition  à  remplir  devient  : 

A'  {x^  +  ^2  +  •••  +  ^'»)  +  ^^'  -\-  '/.  =  O' 

c'est-à-dire  : 

n  {A'z  +  B')  +  X  =-  o. 

Cette  relation  doit  être  satisfaite  quels  que  soient  3-  et  w  ; 
donc: 

c'est-à-dire  que  '}  {z)  est  constant,  et  : 

A'z  J-  B'  =  o. 

Voilà  ce  que  deviendrait  l'analyse  de  Gauss  si  on  voulait 
la  reprendre  en  tenant  compte  de  la  première  observation 
de  M.  Bertrand. 

10.  De  : 

F  [x^  ,z)  =  Kx^  +  B 

on  déduit  aisément  : 

Lcp  [x^,z)  =z  Aœ^  +  B  -}-  LO  [x,]. 

LO  [x^)  représente  une  fonction  de  x^  seulement;  A  et  B 
sont  des  fonctions  de  z,  admettant  des  dérivées  A'  et  B', 


telles  que  : 
Ainsi  : 
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A'^  -^  B'  =  o. 


Ax,  +  B 


Tel  sérail  le  résultat  sans  autre  condition  que  le  postulat 
de  Gauss  sur  la  valeur  moyenne. 

11  entre  encore  deux  fonctions  arbitraires,  0  et  A;  B  est  lié 
k  A  par  une  relation. 
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1.  Une  autre  objection  a  été  faite  à  Gauss. 

La  quantité  que  l'on  doit  prendre  pour  z,  ce  n'est  pas  la 
valeur  la  plus  probable,  c'est  la  valeur  probable.  En  effet,  la 
valeur  la  plus  probable  est  celle  qui  correspond  à  la  plus 
grande  valeur  de  p  ;  elle  peut  être  très  différente  de  toutes 
les  autres,  tandis  que  celles-ci  peuvent  se  grouper  très  près 
l'une  de  l'autre,  ce  qui  donne  fort  à  croire  qu'elles  diffèrent 
très  peu  de  la  véritable  valeur.  Elles  n'interviennent  pas 
dans  la  valeur  la  plus  probable,  tandis  qu'elles  contribuent 
toutes  à  la  valeur  probable  qui  est  par  définition  : 

^{P\  "T~  '^iPi  ~l~  •••     I     '^"Pii- 
La  valeur  probable  de  z  est  :  , 

/  z^  [z]  cp  {x^,  z)  cp  (.^2,  -)  ...  cp  {x„,  z)  dz 


/4ac 
i|/  (s-)  cp  [x^,  z)  cp  (a-2,  z)  ...  cp  {Xu.  z)  dz 


(Les  deux  quantités  sous  le  signe  /  ne  diffèrent  que  par  le 
facteur  z  qui  figure  en  haut). 
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Il  Tant  clioisir  •]/  et  cp  de  façon  que  cette  valeur  probable 
soit  la  valeur  moyenne  : 

^\    ~\     "^2      1"    •••   ~T"  "^'1 

n 

2.  Pour  cela,  je  suppose  que  p  observations  aient  donné 
le  résultat  a:^  ;  p  autres,  le  résultat  x.^:  ...  enfin,  ;)  dernières, 
le  résultat  Xn.  C'est  un  même  nombre  p  et  je  le  suppose 
très  grand. 

Les  deux  intégrales  porteront  sur  j)  facteurs  égaux  à 
<p  [o^^^z)■,  sur  p  facteurs  égaux  à  o  {x^,  ^)---',  sur  p  facteurs 
égaux  à  <p  {x„,  z). 

Je  pose  : 

«I)  =  ï,  {x^,  z)  =-  ix.2,z)...  cp(ifc'„,  z). 
11  s'agit  de  vérifier  : 

f         -^    (z)    <l>Pd3  " 

Cette  égalité  devra  avoir  lieu  quelque  grand  que  soit  p. 
Si,  au  lieu  de  deux  /)  nous  avions  le  rapport  de  deux  il, 
nous  aurions  à  considérer  le  rapport  : 

oùlesX,.X2,  ...  X„  seraient  fonctions  des  a;,,  07.2,  ...a;„etles 
a,,  ao,  ...  a„.  b^^  b.^,  ...  b„  fonctions  de  z. 

Je  suppose  positives  toutes  les  quantités  X.  Quelle  est  la 
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limite  de  ce  rapport  quand  p  croît  indéfiniment  ?  Soit  Xj  la 

tti 


Cl  ■ 

plus  grande  des  quantités  X  :  la  limite  sera  j- 


En  effet,  ce  rapport  peut  s'écrire  : 

'XA'^ 


s« 


Toutes  les  fractions  ^  sont  plus  petites  que  1,   sauf  une 

seule,  celle  qui  correspond  a  k  =  i.  Donc,  quand  p  augmente 

indéfiniment,  le  rapport  considéré  a  bien  pour  limite  -• 
Etendons  ce  résultat  aux  intégrales  : 

/  cp^  {z)^''(iz         et         /'f2  {^)  '^''dz. 

cp,  [z]  joue  le  même  rôle  que  «,-,  et  (&2  (^)  ^I^^^  i,.  Quelle  est  la 
limite  du  rapport  de  ces  intégrales?  Soit  z^  la  quantité  qui 
rend  <ï>  maximum.  Cette  limite  sera  : 


Î2  ^^o) 


c'est-à-dire  ici 


Cette  quantité  z^  doit  être  la  moyenne  arithmétique. 

3.  Nous  revenons  à  la  même  question  que  précédemment  : 
<lï  doit  être  maximum  quand  z  est  la  moyenne  arithmétique. 
Nous  connaissons  la  condition  pour  qu'il  en  soit  ainsi;  c'est: 
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les  dérivées,  A'  et  B',  des  fonctions  de  a-,  A  et  B,  étant  liées 
par  : 

Kz  -I-  B'  =  o. 

Quand  on  suppose  que  cp  dépend  seulement  de  la  dilïV'- 
rence  z  —  a;,,  sa  dérivée  logarithnii(|ue  par  rapport  à  z 

A'x^  -\-  B', 

doit  être  du  premier  degré  en  ^^  —  x^  ;  alors 

A'  et  0  (a?,)  sont  constants. 

Dans  le  cas  général,  c'est-à-dire  quand  on  ne  suppose  pas 
que  o  dépend  seulement  âe  z  —  a;, ,  il  reste  pour  a>  {x^ ,  z)  trois 
fonctions  arbitraires  à  déterminer  :  d'abord  -]/  (z),  que  l'ana- 
lyse actuelle  ne  permet  plus  de  déclarer  constant  comme 
dans  le  calcul  de  la  valeur  la  plus  probable  ;  puis  9  (a^J  ;  puis 
A.  Quant  à  B,  il  est  lié  à  A  par  une  relation. 

4.  11  sagit  de  déterminer  un  peu  plus  complètement  ces 
fonctions  arbitraires. 

Je  vais  supposer  p  observations  donnant  pour  résultat  x^  : 
la  moyenne  arithmétique  sera  x^  ;  alors  : 


<I>  =  ^  {x^)  e- 


et  l'on  doit  avoir 


Çz^  {z)  <]>Pdz  =  x^  Ç^  [z)  '\fPdz  ; 
d'où  : 

'J(.~  -  X,)  ^  [z)  e^^^^^  +  ^^  dz  =  o. 


()P 
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Cette  relation  doit  être  satisfaite  quels  que  soient  p  et  x^ 
OP  a  pu  sortir  du  signe  /  puisqu'il  ne  contient  pas  -s-,  et 

nous  ne  pourrons  le  déterminer  par  cette  condition. 

5.  Cherchons  4^  (^•). 

Aa;^  -|-  B  est  une  fonction  de  z  qui  atteint  son  maximum 
pour  z  =  x^  ;  soit  u^^  ce  maximum.  Je  puis  donc  poser  : 


Ax^  -f-  B  =  M§ 


u  sera  réel. 
De  même 


f  [z  —  x^]■^{z)  dz 


est  une  intégrale  qui  est  toujours  positive,    et  ne  s'annule 
que  pour  z  ■=  x^  \  je  puis  donc  la  poser  égale  à  v'^,  d'où  : 

A.x^  -|-  B  =  M^  —  M^, 

(5-  —  x^)  ■if  {z)  dz  =:  ^vdv. 

Pour  achever  de  définir  m  et  u  il  faut  s'en  donner  le  signe, 
car  nous  avons  seulement  défini  i'^  et  v^.  Nous  conviendrons 
de  donner  à  u  et  à  u  le  signe  -j-  si  ^  est  plus  grand  que  x^ 
et  le  signe  —  dans  le  cas  contraire  ;  u  et  u  sont  donc  tou- 
jours de  même  signe. 

D'ailleurs  : 

u'I  =  A  [x^)  a?,  +  B  [x^). 

L'intégrale  examinée  devient,  en  faisant  sortir  une  cons- 
tante : 


/  ^Ivdv 


e    '"'- 
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Je  puis  supposer  v  exprimé  en  fonction  de  u  : 

2vdv  =  f  (u)  du, 
et  alors  : 


fr(u) 


e-P"-  du 


doit  être    nulle,    quel  que  soit  p,   lorsque   les  limites  sont 
—  oc  ei  -\-  ce  . 

6.  Cela  ne  peut  arriver  que  si  f{ii)  est  une  fonction  impaire. 
En  changeant  u  en  —  u,  on  aurait: 


ff{—  u)  e-'"'-  du  =  o, 


d'où 


Cette  relation  doit  être  vraie  quelque  grand  que  soit  ;). 
Si  /■  {u)  est  impaire  : 

f  (u)  +  /■(—  u)  =  o. 

Si  f  {u)  n'est  pas  impaire,  je  développe  suivant  les  puis- 
sances croissantes  de  u.  L'intégrale  ne  pourra  être  égalée  à 
zéro  quel  que  soit  p. 

En  effet  : 

f(u)  -}-  f  {—  u)  =  xu-"  -f-  .3^r"  +  ^.. 
Je  vais  poser  : 
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l'intégrale  va  devenir  : 


P"    ^  P"^'    ^       )  i 

et  elle  doit  être  identiquement  nulle. 

Si  nous  multiplions  par  p"+ 2  tous  les  termes,  le  premier 

ne  contiendra  plus  ]),  et  les  autres  le   contiendront  encore  ; 

1 
l'intégrale,  au  facteur  près  p'*  +  2,  se  réduira    sensiblement 

pour  p  très  grand  à 


'J   -GO 


qui  n'est  pas  nulle. 

Donc  f  (?y)  doit  être  fonction  impaire  de  u. 

7.  On  a  posé: 

[z  —  ^))  ^  (-^)  dz  =  f  [u)  du. 

Difîérentions,  en  considérant  x^  comme  constant,  l'autre 
e'quation  en  i<, 

kx^  -|-  B  =  M^  —  u^\ 
il  vient  : 

dz  [Mx^  -j-  B')  ^  —  "iudu  ; 

or,  en  tenant  compte  de  la  relation 

A'^  +  B'  =  o, 
A'^^  -f-  B'  =  A'd7,  --  h^  z  —  —  M  [z  —  x^). 

Donc  : 

A  {z  —  x.)  dz  =z  Indu, 


TREIZIÈME    LEÇON  163 

d'où  : 


— ^— ^  est  une  fonction  paire,  donc  ^-tt-  ne  doit  pas  chan- 
^l  "^  A  "^ 

ger  quand  on  change  m  en  —  u. 

Or     ■ ,-  n'est  pas  une  fonction  de  h,    mais  une  fonction 

de  z  indépendante  de  x^  ;  je  dis  qu'elle  doit  se  réduire  à  une 
constante. 

En  effet,  je  considère  deux  valeurs  quelconques  de  5,  z^ 
et  z^,  pour  lesquelles  A  et  B  prennent  respectivement  les 
valeurs  A,  et  B^,  A3  et  Bj  ;  je  vais  choisir  x^  de  façon  que  : 

^^x^  -f-  B)  =  ^.',x^  -\-^2- 

u^  —  u-  reprendra  alors  la  même  valeur  pour  z^  et  z.^. 

Donc  '  '  qui  n'est  fonction  que  de  u-  reprendra  aussi  la 
même  valeur  et  on  aura  : 

•^  (^<)  _  iJf^) . 

A'  [z,)  -  A'  (.-,) 

Donc  '^^-)rr  est  constant. 
A 

8.  Ainsi  la  manière  la  plus  générale  de  satisfaire  au  pos- 
tulat de  Gauss  (modifié  conformément  à  l'objection  de 
M.  Bertrand,  à  savoir  que  la  moyenne  est  la  valeur  pro- 
bable), se  traduit  par  : 
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9.  Considérons  : 

J  -00 

Je  dis  que  cette  intégrale  est  nulle,   c'est-à-dire   que   la 
moyenne  est  la  valeur  probable. 
Je  vais  poser  : 

X  (   -|—  X.2  -\-  • .  ■   — p  X-ii 

n  ' 

et: 

cp  (a?,,  z)  <p  (^2,  z)  ...  cp  (.%•„,  z)  =  0  [x^]  0  (0^2)  ...  0  (a^„)  gP. 
L'exposant  P  peut  s'écrire  : 

P  =  —j^  iz)  [{z  —  a;,)  -h  (3-  —  ^2)  +  ...  +  (^  —  a;,,)]  0^3-, 

c'est-à-dire  : 

?  —  —  n  Ç'i^  [z){z  —  x)  dz. 

Il  reste   donc   à   démontrer   que  l'intégrale   suivante    est 
nulle  : 

Si  nous  posons  : 

{  {z  —  X)  ^(5-)  dz  =  M-, 

d'où  : 

(3-  —  x]^  (^)  dz  =  ^M  C?î?, 
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l'intégrale  envisagée  se  réduit  à  : 

20  yoo^]  0  {oc.^)...  0  {cc„<  Cue-""^  du. 

Elle  est  nulle  quand  «  varie  de  —  ce  ii  -j-  x. 

10.  La  fonction  o  dépend  ainsi  de  (]/,  et  -j/  dépend  de  la 
connaissance  que  nous  pouvons  avoir  a  priori  de  la  probabi- 
lité relative  à  z. 

œ  dépend  de  Tliabileté  de  l'observateur  et  de  la  probabilité 
a  priori  pour  qu'il  se  trompe. 

Il  n'y  a  aucune  raison  pour  que  ces  deux  probabilités  a 
priori  dépendent  l'une  de  l'autre.  La  seule  hypothèse  raison- 
nable est  donc  de  supposer  -];  =  1  pour  retrouver  la  loi  de 
Gauss. 

11.  Reste  6(a?<). 

Rien  n'oblige  à  supposer  cette  fonction  égale  à  I.  On  sait, 
par  exemple,  que  certaines  observations,  telles  que  les 
observations  méridiennes,  sont  sujettes  à  une  cause  d'erreur 
particulière  que  Ton  a  appelée  Verreur  décimale. 

Quand  on  mesure  une  quantité,  quand  on  effectue  vme 
lecture,  on  évalue  le  résultat  jusqu'à  un  certain  ordre  d'uni- 
tés, et  le  nombre  qu'on  donne  est  celui  qui  se  rapproche  le 
plus,  dans  cet  ordre,  de  la  grandeur  qu'on  veut  connaître. 

Or,  on  a  remarqué  que  chaque  observateur  semble  affec- 
tionner certaines  décimales  ;  on  exprimera  analytiquement 
ce  fait  en  disant  que  6  [x^]  est  périodique,  et  qu'elle  devient 
maximum  pour  ces  décimales. 

12.  Quelle  opinion  faut-il  avoir  de  ce  postulat  de  Gauss? 
Dire  qu'il  est  admis  par  tout  le  monde,  ce  n'est  pas  le  justi- 
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fier,  car  tout  le  monde  n'a  peut-être  pas  une  connaissance 
suffisante  de  ce  qu'est  une  loi  des  erreurs. 

Si  nous  avions  appliqué  les  mêmes  raisonnements  à  z^, 

a;?  +a?|  -f  ...  -\-  xf, 
z-  = î 

71 

la  valeur  adoptée  pour  z  eût  été  : 


=v/^ 


î  ~r  ^2  "t~  •••  ~r  ^iî 


On  peut  se  trouver  en  présence  d'une  série  de  mesures 
portant  sur  le  carré  d'une  grandeur  inconnue,  et,  d'après  le 
postulat,  il  faut  prendre  la  moyenne  des  n  quantités  directe- 
ment observées. 

M.  Bertrand  donne  comme  exemple  une  aiguille  qui  indi- 
querait le  carré  de  l'angle  mesuré.  Devrait-on  prendre  la 
moyenne  des  lectures  de  l'aiguille,  c'est-à-dire  la  moyenne 
du  carré  des  angles,  ou  la  moyenne  des  angles  eux-mêmes? 
Aucune  de  ces  deux  solutions  ne  serait  raisonnable.  La 
mesure  de  cet  angle  comporte  deux  erreurs  :  1°  l'erreur  de 
visée,  et  l'erreur  de  visée  probable  serait  l'erreur  moyenne 
de  l'angle  ;  2°  l'erreur  de  lecture,  et  l'erreur  de  lecture  pro- 
bable serait  l'erreur  moyenne  du  carré  de  l'angle. 

13.  La  règle  de  la  moyenne  semble  donc  dénuée  de  sens. 
Pourquoi  cependant  ne  nous  trompe-t-elle  guère?  Pourquoi 
est-il  légitime  de  prendre  la  moyenne?  C'est ^  au  fond,  jiarce 
que  les  erreurs  sont  très  petites. 

Si,  au  lieu  de  z,  je  mesure  /  [z],  et  que  j'applique  à  f{z)  le 
postulat  de  Gauss  : 
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j'aurai,  puisque  x^  est  très  voisin  de  z, 

f[x,)=f[z)-{-{x,-z)r[z). 

et  de  même  avec  x.^  ...  x„.  J'en  déduirai  : 

c'est-à-dire  : 

S  [x^  —z)  =0, 
ou  : 

nz  =  x^  +  ^2  +  •••  +  ^"' 

On  arrive  donc  au  même  résultat  qu'on  ait  mesuré  direc- 
tement la  grandeur  z  ou  une  fonction  quelconque  f  [z]  de 
cette  grandeur. 

Voilà,  en  somme,  pourquoi  on  a  le  droit  de  prendre  la 
moyenne. 

14.  D'un  autre  côté  est-il  si  exact  qu'on  se  borne  à  prendre 
la  moyenne?  Ce  principe  est-il  si  incontesté? 

Sur  n  observations,  s'il  arrive  que  n  —  1  soient  très  voi- 
sines l'une  de  l'autre  et  que  la  n^  en  soit  très  éloignée,  pren- 
dra-t-on  la  moyenne  ?  Le  résultat  serait  très  différent  du 
centre  de  gravité  des  «  —  1  premières  observations,  des 
n  —  1  bonnes  observations.  Certains  expérimentateurs 
écartent  la  n''  :  il  y  a  eu,  disent-ils,  accident,  et  cette  obser- 
vation est  mauvaise. 

Mais  alors  la  valeur  prise  n'est  plus  la  valeur  moyenne  : 
on  a  eu  une  raison  de  rejeter  le  postulat. 

Quand  on  adopte  la  loi  de  Gauss,  l'erreur  probable  sur  la 

movenne  est  -7-  ;  de  sorte  qu'en  multipliant  les  observations 
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on  devrait  aboutir  à  une  précision  de  plus  en  plus  grande. 
Et  cependant,  quand  on  mesurera  un  mètre  un  million  de 
fois,  sans  vernier,  on  ne  le  connaîtra  jamais  à  un  millième 
de  millimètre  près,  à  un  micron  près. 

Cela  s'explique  d'ailleurs  :  pour  de  très  petites  grandeurs 
observées,  on  ne  peut  répondre  de  rien,  il  n'y  a  pas  davan- 
tage de  raisons  pour  que  l'erreur  soit  comprise  entre  0  et  1 
micron  que  pour  qu'elle  soit  comprise  entre  1  et  2  microns. 

15.  Dans  la  leçon  suivante,  j'établirai  le  théorème  sui- 
vant : 

Quand  on  prend  la  moyenne,  le  carré  de  l'erreur  commise 
est: 

_  cc^  4-  ^2  +  •••  +^^>y. 


Quelle  que  soit  la  loi  des  erreurs,  Gauss  démontre  que  la 
valeur  probable  de  cette  expression  tend  vers  zéro  quand  n 
augmente  indéfiniment. 

Cela  justifie  le  choix  de  la  moyenne  :  elle  devient  de  plus 
en  plus  probable  à  mesure  que  n  augmente,  sans  être  la 
plus  probable. 

Mais  cette  manière  de  justifier  le  choix  de  la  moyenne 
indépendamment  de  la  loi  des  erreurs  est,  pour  ainsi  dire, 
une  réfutation  du  raisonnement  de  Gauss  exposé  plus  haut, 
puisque  ce  raisonnement  prétend  établir  qu'une  certaine  loi 
très  particulière  est  la  seule  qui  puisse  justifier  l'emploi  de 
la  moyenne  qui  est  la  pratique  universelle. 

Il  est  assez  étrange  que  cette  réfutation  soit  due  à  Gauss 
lui-même. 
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1.  Soit  z  la  quantité  à  mesurer. 

La  probabilité  pour  que  le  résultat  de  la  mesure  soit  com- 
pris entre  x^etœ^-\-  û?£c^  peut  être  représentée  par  cp  {x^ ,  z)  dx^ . 

Gauss,  nous  lavons  dit,  suppose  que  o  ne  dépende  que 
^Q  2  —  x^  ;  la  probabilité  sera  alors  cp  (^  —  a?,)  dx^  ;  de  plus, 
il  suppose  qu'il  n'y  a  pas  d'erreur  systématique,  c'est-à- 
dire  que  a  est  une  fonction  paire  et  ne  cbange  pas  quand  on 
y  substitue  x^  —  z  k  z  —  x^. 

Soit  y^  l'erreur  : 

y.  =  .r,  -  z. 

La  probabilité  est  cp  {^/^)  dy^. 

Nous  aurons  à  considérer  la  valeur  probable  de  y,,  et, 
plus  généralement  celle  de  y,'';  ce  sera: 


/ 


+  x 

-00 


Comme  -^  est  une  fonction  paire,  si  p  estimpair, cette  inté- 
grale est  nulle. 

2.  On  peut  faire  deux  observations,  y^  et  y^,  et  avoir  à 
considérer  la  valeur  probable  d'une  fonction  de  \^/^  et  y^,  par 
exemple  y"h  y'\  . 

ç  {y^)  est  la  probabilité  pour  que  la  première  erreur  soit 
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comprise  entre  y^  et  ?/,  +  dy^  ;  cp  [ij.^  la  probabilité  pour  que 
la  seconde  erreur  soit  comprise  entre  y^  et  y.^  +  dy^. 
La  valeur  probable  de  2/'"i  y^'S  sera  par  définition 

les  intégrales  étant  prises  de  —  ce  à  -(-  oc  par  rapport  à  ?/, 
et  par  rapport  à  y.^. 

Comme  la  fonction  sous  le  signe  /  /  est  le  produit  d'une 

fonction  de  y^  par  une  fonction  de  y^,  et  que  les  limites  sont 
constantes,  cette  intégrale  double  sera  le  produit  de  deux 
intégrales  simples  : 

J  y"l^  ?(!/.)  ^hJify'l^  'f  [y-i)  dy^. 

Ceci  montre  que  la  valeur  probable  du  produit  est  le  pro- 
duit des  valeurs  probables  des  facteurs. 

Il  faut  que  les  deux  facteurs  soient  différents  :  la  valeur 
probable  de  y\  par  exemple  ne  serait  pas  le  carré  de  la  va- 
leur probable  de  y'f  ;  mais  la  valeur  probable  de  y'}  yl  sera 
le  produit  des  valeurs  probables  de  yj  et  de  yl. 

3.  Supposons  771.2  i^^l-  ^^^  l'intégrale 


/: 


'f  (y 2)  dy-i' 


nous  devrions  avoir  la  valeur  probable   de  l'unité,  c'est-à- 
dire  1  ;  or  il  est  évident  que  : 


/ 


?  {y 2)  dy-2  =  *  ' 

-  00 
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car  cette  intégrale   représente  la    |)roI)aI)i]iti''   jjour  que  y.^ 
soit  compris  entre   —  x  et  -|-  x  ,    c'est-à-dire  la   certitude. 

4.  Si  l'on  a  effectué  plusieurs  observations  y^,  y.,...,  yn,  la 
valeur  probable  d'une  certaine  fonction  (]/  de  ces  observa- 
tions sera  : 

y?  (2/<)  ?  [y-i)  ■■■  ■?  (3/")  ^(^r  ^2'  •••  y»)  dyi,  cly.,  ...  dy„. 

Si  la  fonction  ^  est  impaire,  les  éléments  de  l'intégrale 
seront  deux  à  deux  égaux  et  de  signes  contraires,  l'intégrale 
sera  nulle. 

5.  Je  reviens  à  l'iiypotlièse  de  Gauss. 


?  (y)  =  \/[ 


^-v. 


La  valeur  probable  dey^f+',  avec  cette  hypothèse,  est  zéro; 
cherchons  la  valeur  probable  de  y-^  :  c'est,  par  définition, 


Observons  d'abord  que  : 


^-j+X         ,- 
/  \J\(i-'"j'y^Pdy. 


\/!-'^' 


dy 


ou: 


Ce- '•!/'- dy  =  Vît  h'-^- 
Je  différentie  celte  égalité  p  fois  par  rapport  à  h  : 
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Le  signe  —  est  répété  p  fois  dans  chaque  membre,  il  dis- 
paraît. 

r      ,  o  ,    ,  /-  ,-p-\  1.3.S  ...  f2M—  1) 

D'autre  part  : 

2.4.6  ...  2p  =  2/'.p  ! 


^ 


La  valeur  probable  y-i'  est  le  produit  de  l'intégrale  par 
h 


'i  on  a  donc 


1     -p! 
hP  p  !  22/^* 


6.  Ce  résultat  a  été  obtenu  dans  l'hypothèse: 

une  question  se  pose  :  la  loi  de  Gauss  est-elle  la  seule    pour 
laquelle  ce  résultat  se  produit?  C'est  la  seule. 
Cherchons  la  valeur  probable  de  : 

Par  définition  c'est  : 


/V! 

«^  —on 


e-/'i/-  e-"'î/u-2/)Vy. 


On   peut   calculer   directement   cette  intégrale  ;    on  peut 
aussi  développer  e-"^y^~y^'  en  série  convergente  pour  toutes 
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les  valeurs  de  y: 

e-"(!/o-i/f-  ~  V  A/,y. 
D'où: 

/        \/ -  e-  y-e-'"y  -y>-cly  =  s  Kp^. 

J  -ce 
De  même,  avec  une  autre  fonction  ç.  que  celle  de  Gauss, 

Ç        3>  y)  e-"^y^-y'>''-dy  =  S  A^p^\ 


Par  hypothèse^  les  valeurs  moyennes  de  y'^^  seraient  les 
mêmes  dans  les  deux  cas.  Le  rapport  des  deux  intégrales 
serait  donc  1. 

Comme  ce  rapport  reste  le  même  quel  que  soit  w,  servons- 
nous  d'un  théorème  précédemment  démontré. 

La  limite  du  rapport 

Jr,  'y    9"  iy)  dy 
j  h  !>  '  ?"  ^y)  dy 
quand  n  croîtra  indéfiniment,  sera: 

si,  dans  les  limites  de  l'intégration,  'a  [y)  atteint  son  maxi- 
mum pour  y  =z  y^. 

Ici  e-'y-yo)-  atteint  son  maximum  pour  y  :=  y^]  la  limite 
du  rapport  des  deux  intégrales  est  : 


v/! 
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Comme  ce  rapport  reste  toujours  égal  à  1  : 


^^0^  =  V  ;  '" 


hyo 


Pq  étant  tout  à  fait  quelconque,  c'est  dire  que  la  loi  de 
Gauss  est  la  seule  qui  donne  à  y-P  la  valeur  probable  que 
nous  avons  vue. 

7.  Supposons  que  la  loi  des  erreurs  soit  quelconque. 

On  a  fait  n  observations,  ayant  donné  n  erreurs  indivi- 
duelles y,,  t/j...,  -i/n-  Prenons  la  moyenne  des  observations: 
nous  commettrons  une  erreur,  qui  sera  la  moyenne  des  er- 
reurs individuelles, 

.v<  +  y -2  4-  •  •  •  +  y» . 

n 

Gauss  s'est  proposé  de  calculer  la  valeur  probable  du 
carré  de  cette  erreur  ;  c'est  par  définition  : 

Je  développe  ce  carré  : 

/.y.  +^2 +  •••  +  . VA  -  ^  M  ,  ^-y..v-2 

La  valeur  probable  cherchée  sera  : 


La  valeur  probable  du  produit  l/^i/.2  est  y^  y^V^'i  comme 
les  fonctions  y^  et  y.^  sont  impaires,  y^  et  y^  seront  nulles. 
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Il  reste  donc  : 

yf  4-  .vl  +  •  •  •  +  .vF 

n- 

L'intégrale  se  ramène  à  une  somme  de  n  intégrales  ;  mais 
chacune  d'elles  porte  sur  la  même  fonction  : 

multipliée  par  ]/'jdi/f,  ou  yldy.,,  ...  ou  yldy^.  C'est  donc  la 
même  intégrale  aux  notations  près. 

Donc  la  valeur  probable  du  carré  de  l'erreur  est  : 

Ainsi  la  valeur  probable  du  carré  de  l'erreur  commise  est 
le  carré  de  la  valeur  probable  d'une  erreur  individuelle  di- 
visé par  n. 

Cette  propriété  suffit  pour  justifier  l'emploi  des  moyennes; 
elle  a  lieu  quelle  que  soit  la  loi  des  erreurs. 

La  loi  de  Gauss  est  la  seule  pour  laquelle  la  moyenne  soit 
la  valeur  la  plus  probable. 

Avec  toute  autre  loi,  la  moyenne  deviendra  de  plus  en 
plus  probable  quand  les  observations  deviendront  de  plus 
en  plus  nombreuses,  mais  elle  ne  sera  pas  la  valeur  la  plus 
probable. 

8.  Voici  d'autres   considérations  qui,  dans   certains  cas, 
peuvent  justifier  la  loi  de  Gauss. 
Cherchons  la  valeur  probable  de  : 

y,  +.V,  +  •••-f-.vA  -^-  V 
n 
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c'est  une  fonction  impaire  que  nous  élevons  à  une  puissance 
impaire  :  la  valeur  probable  doit  être  nulle. 
Cherchons  la  valeur  probable  de  : 

y,  +  y.,  +  ...  ^y,;\"' 


Par  une  formule,  généralisation  de  celle  du  binôme, 


9^1  I 


(y,  +  ^2  +  •■•  +  Vn?"  =  y-  ,    f  •    ,.  ,  ^î'?/^  ...  yy 


aj,!^^  ^'       ^  ^\>-' 


ou  : 


0^1   +  ^o  -|-  . . .  +  '^!J.  =  2p. 


11  faut  prendre  la  valeur  moyenne  de  chaque  terme  et  la 
diviser  par  n'^f. 

La  valeur  moyenne  de  certains  termes  sera  zéro,  si  l'un 
des  exposants  a  est  impair.  Tous  les  exposants  doivent  être 
pairs  pour  que  cette  valeur  soit  différente  de  zéro. 

9.  Traitons  comme  exemple  : 

iî/i  +//2  +  •••  +  i/>,Y'- 

Les  a  ne  peuvent  être  pairs  que  si  :  1°  z,  ^=  4,  et  les 
autres  nuls;  ou  2°  oc,  =  oco  ^  2;  ce  qui  conduit  à  : 

Sy]  +  0-:y^yl  +  R. 

R  est  l'ensemble  des  termes  dont  la  valeur  moyenne  est 

4  ' 
nulle;  le  coefl'icient  de  Si/ft/|  est  ^yT~\  -~  '^• 

Traitons  encore  : 

(y.  +.V2  +  .  ■-\-ynf- 
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Les  a  ne  peuvent  être  pairs  que  si  :  1"  a^  =  6;  ou  "1"  a^  =  4, 
a^  =  2;  ou  3»  a,  =  a2  =  ag  =  2. 

R  étant  l'ensemble  des  termes  dont  la  valeur  moyenne  est 
nulle,  on  a  : 

(2/,  4- •••  +^2  -f  y»r  =  ^z/i^4- 1^  ^i/\!/l +90  ^i/lyy^  +  H- 

()  ! 
Le  coefTicient  de  ^y\yl  est     ,     .  =  13;  le  cocificient  de 

s.y?.yiyiest5y|y^=90. 

Je  m'en  vais  convenir  de  désigner  la  valeur  moyenne  de  t/ï 
par  Mp.  D'abord  la  valeur  moyenne  de  y,  -|-  ...  -\-  y.,  ~\~  VnY 
sera  : 

,  n  (n  —  V 


(y.  +2/2  +  ...  +  VnY  =  nM,  +  6  — ^ '  M|. 

En  effet,  dans  S?/|  tous  les  termes  ont  la  mémo  valeur 
moyenne,  et  il  y  en  a  ;;  ;  dans  Syf  ?/|,  tous  les  termes  ont  la 

1                               -1                ^  (^  —  1) 
même  valeur  moyenne  et  il  y  en  a 

La  valeur  moyenne  de  (y,  -\-  !/■>  ~ï~  •••  +  2/«'^  sera  : 

nfn — i  \(rt — ^\ 

(y<-^.V2+---+.V-v)'=^Mc+15n(n-l)M,,M,+90  '       ^         'M^- 

Dans  ^y\y\,  il  y  a  autant  de  termes  que  d'arrangements 
den  lettres  2  à  2;  le  coefiicient  de  MjM.^  est  donc  \on  [n —  l). 

10.  On  pourrait  poursuivre  avec  d'autres  valeurs  de  2^j  ; 
les  expressions  deviendraient  de  plus  en  plus  compliquées. 

Tenons  compte  de  ce  que  w  est  très  grand  ;  il  y  a  dans  le 
second  membre  des  termes  en  n,  en.n^,  en  w^,  etc. 

A  titre  d'approximation,  ne  considérons  que  les  termes  du 
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degré  le  plus  élevé  en  n.  Pour  2jo  =  4,  ce  terme  est  Sn^Mf  ; 
pour  2p  =  6,  ce  terme  est  ISn^M^. 
Ainsi  l'erreur  moyenne  : 


^.  y<  -^  ^2  +  •••  +  y. 

"^  n 


a  comme  valeur  probable  de  sa  quatrième  puissance  : 

et  de  sa  sixième  puissance  : 

,e  ^  1,  (^-.J  . 

Calculons  cette  valeur  probable  en  général  : 

{y.^y. + ... + vn?''  -  y,  [^jz!fz^\  E ^•'•^^^■^  -  y''/']- 

'  Dans  le  second  S  on  ne  permute  que  les  indices  des  y. 

Ne  conservons  que  les  termes  où  tous  les  a  sont  pairs  ;  les 
autres  ont  une  valeur  probable  nulle.  Il  vient  : 


2)0  ' 


[y^  -f  y.  +  -  +  y,:?"  =  ^ ,  ■    T"  ;  ,-  NM«,M«, ... M« 

^"^  x^  .  o.^  ....  api .  t* 

Tous  les  termes  sous  le  second  S, 

^y^^yf'  •••  y^^-^ 

ont,  en  effet,  la  même  valeur  probable.  Soit  N  leur  nombre  ; 
évaluons  N. 

11.  Je  suppose  d'abord  (x^  =  ao.  Si  nous  permutons  y^  et 
y.,,  nous  retrouvons  le  même  terme.  Si  nous  tenions  compte 
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de  l'ordre,  nous  aurions  autant  de  termes  que  d'arrange- 
ments 2  à  2  de  (j.  lettres  choisies  dans  les  w  lettres  .y^^aï  ••■  yn\ 
nous  pourrions  ainsi  avoir  des  termes  répétés. 

Si  les  UL  exposants  étaient  dilTérents,  N  serait  égal  au 
nombre  des  arrangements  de  n  letli'es  \i.  à  [7.,  c'est-à-dire 

n  ! 

égal  à :• 

"         n  —  [j.\ 

Je    suppose  \J.^  exposants  égaux  à  a,,  ij^  à  ag,  ...  ;j^k  à  ax  ; 

de  plus,  je  suppose  a,,  ao,  ...,  (Xk  différents,  et  : 

!^-)  +  y-j  +  •••  +  i-'-K  =  y- 

Je  considère  l'un  des  arrang-ements  formés  avec  ces  expo- 
sants ;  j'y  permute  d'une  manière  quelconque  les  (^.^  lettres 
dont  l'exposant  est  a^,  les  [jlj  lettres  dont  l'exposant  est  ag,  ..., 
les  ulk  lettres  dont  l'exposant  est  aR.  Je  ne  change  pas  le 
terme  correspondant;  par  conséquent,  ce  même  terme  serait 
reproduit  par  : 

a,  !  u-o  !  ...  uk! 
arrangements. 

N  = 


'il   '  ,1   ' 


n  —  \j.  !  y..  !   ao  !   ...  'Xk  ' 


^  _  n{n  —  \\  ...  (n  —  g  -f-  1) 
—  Il  I  * 

Ainsi  N  est  un  polynôme  du  degré  ij.  en  n. 

La  plus  grande  valeur  que  puisse  prendre  tji.  est  p. 

En  effet  : 

*<    +   *2  +   •••    +^!Jl=   "^P- 

Les  a  étant  tous  pairs,  la  plus  grande  valeur  de  [j.  corres- 
pondra à  : 

a.^  =  7..2  =  ...  =  ajj.  =  2. 
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Il  n'y  aura  donc  qu'un  seul  terme  de  degré  p,  par  rapport 

à  n.,  dans  N;  avec  notre  ordre  d'approximation,  c'est  le  seul 

que  nous  devons  conserver.  Réduit  à  ce  terme,  N  a  la  valeur 

suivante  : 

^  n  {n  —  •!)  ...  in  —  p  4-1) 

~~  p  ! 

En  effet,  tous  les  a  étant  égaux,  il  en  résulte  que  les  lettres 
[x^,  [J..2  ...,  [j-K  se  réduisent  à  : 

[X,  =  a  ■=  2i 
[J-2  =  •••  =  P-K  =  o. 

Dans  N,  le  terme  en  71''  est  : 

p\' 
12.  D'autre  part,  a^,  ao,  ...  ajj.  étant  égaux  à  2  : 

Mal  =  Ma,  =  ...  =M^I^=  Mo, 

où  M2  estla  valeur  pi'obablc  du  carré  d'une  erreur  individuelle, 
La  valeur  probable  de  (y^  +  .V2  +  •••  "h  2/«)^^  6st  donc  : 


9n  '  r)!' 


zn  '  n'' 

La  valeur  probable  de  i/-''  s'en  déduit  en  divisant  par  n^'' 


y  —  ^  1 9/, 


Comparons  avec  le  résultat  donné  par  la  loi  de  Gauss  ;  on 
doit  avoir  : 
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OU  : 

La  loi  de  Gauss  est  la  seule  qui  conduise  à  celte  expres- 
sion pour  la  valeur  probable  de  l'erreur. 

Pourvu  ([u'il  n'y  ait  pas  d'erreurs  systématiques,  et  qu'on 
fasse  un  grand  nombre  d'observations,  en  prenant  leur 
moyenne,  on  commet  donc,  avec  cotte  moyenne,  une  erreur 
dont  la  probabilité  est  conforme  à  la  loi  de  Gauss. 

L'erreur  commise  avec  un  instrument  est  la  résultante 
d'un  très  grand  nombre  de  petites  erreurs  indépendantes  les 
unes  des  autres,  et  telles  que  chacune  d'elles  n'entre  que 
pour  une  faible  part  dans  le  résultat;  l'erreur  résultante 
suivra  la  loi  de  Gauss. 
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1.  Posons  le  problème  d'une  autre  manière. 

On  a  commis  dans  les  observations  un  certain  nombre 
d'erreurs  individuelles,  y^,  y.^,...  y,.,  indépendantes  les  unes 
des  autres  ;  l'erreur  totale  est  : 

y  =  y\  -h  .^2  +---  +  y«- 

Supposons  d'abord  que  toutes  ces  erreurs  suivent  la  même 
loi,  et  qu'il  n'y  ait  pas  d'erreurs  systématiques.  Le  problème 
est  le  même. 
-   La  valeur  probable  de  y'^P-^  '  sera  nulle. 

Nous  avons  évalué  dans  la  dernière  leçon  la  valeur  pro- 
bable de 


Ici  nous  avons  à  chercher  la  valeur  probable  de 

(y.  +2/2  +  •••  -t-^«j 

La  probabilité  pour  que  yi  soit  comprise  entre  a  et  p,  deux 
limites  données, 

\  ?  iyi)  dyt 

est  la  même  par  hypothèse  pour  3/^,  y.^^  ...,  ?/„. 
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Il  nous  suffit  de  multiplier  le  résultat  obtenu  pour  la  valeur 
probable  de  (-V.  +•.'/.  +  -+ .V^y^  c'est-à-dire  ^  (^^)", 
par  w^/',  pour  obtenir  la  valeur  probable  de  y-''  : 


_  ^  ^2p!  /nM,y^ 


et,  en  posant  nM,  =  M, 


Ainsi  la  forme  de  cette  expression  reste  la  même,  et,  en 
raisonnant  comme  dans  la  dernière  leçon,  on  conclurait  que 
la  probabilité  pour  que  Terreur  totale  y  soit  comprise  entre 
deux  limites  données  reste  conforme  à  la  loi  de  Gauss. 

2.  Ce  raisonnement  n'est  pas  encore  satisfaisant,  parce 
qu'il  est  peu  vraisemblable  que  toutes  les  erreurs  indivi- 
duelles suivent  la  même  loi.  Supposons  que  la  loi  ne  soit  pas 
la  même,  mais  que  toutes  les  erreurs  individuelles  soien  t 
sensiblement  du  même  ordre  de  grandeur  et  que  chacune 
d'elles  contribue  pour  une  faible  part  à  l'erreur  totale  ; 
soient  : 


L 


la  probabilité  pour  que  l/^  soit  compris  entre  a  et  ^  ; 

«^  a 
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la  probabilité  pour  que  y^  soit  compris  entre  a  et  fl  ; 


tJ  a. 


la  probabilité  pour  que  y^  soit  compris  entre  a  et  p. 

Je  suppose  toujours  cp,,  cp.,,...  cp„  fonctions  paires,  autre- 
ment dit  qu'il  n'y  a  pas  d'erreurs  systématiques. 

Je  prends  la  somme  M  des  valeurs  moyennes  des  carrés 
des  erreurs, 

Si  toutes  les  erreurs  particulières  suivaient  la  même  loi, 
on  aurait  la  même  valeur  M2  pour  î/f,  »/|,  ...,  y\^  et  la 
somme  M  serait  nM.^. 

Je  me  bornerai  au  calcul  correspondant  aux  premiers 
exposants. 

En  supposant  que  toutes  les  erreurs  suivent  la  même  loi, 
nous  avons  trouvé  que  la  valeur  moyenne  de  y''-  est  M  ;  celle 
de  y\  3M2;  celle  de  ?/«,  15  M^  ... 

Refaisons  le  même  calcul  en  supposant  la  loi  différente 
pour  les  différentes  erreurs  individuelles.  J'observe  que  le 
produit  y'ly'2  a  pour  valeur  moyenne  la  valeur  probable  de 
î/',",  multipliée  par  la  valeur  probable  de  y\.  En  effet,  la 
valeur  probable  du  produit  y"\y\  sera  représentée  par 

//î.  bi)  ?2  (^2)  y'"y'-ïdy^dy^  ; 

le  produit  des  valeurs  probables  de  y'"  et  de  y'^  sera  repré- 
senté par 

/?<  (.V<)  y"y  dytj^^  (1/2)  y 2  dy^. 
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Le  théorème  reste  donc  vrai  dans  ce  cas-ci  comme  dans 
le  précédent;  et  si  m  est  impair,  la  valeur  probable  sera 
nulle. 

La  différence,  c'est  que  les  valeurs  probables  de  y'^,  y'^, 
...,  y'",  ne  sont  plus  égales  entre  elles. 

Remarquons  aussi  que  les  quantités  ç-,,  0^21  •••  ?«  sont 
censées  du  même  ordre  de  grandeur. 

3.  Valeur  moyenne  de  y^  : 
Donc  : 

le  dernier  terme  disparaît;  il  reste  : 

y^  =  2^  =  M. 

Valeur  moyenne  de  y^  : 

en  laissant  de  coté  les  termes  où  figurent  des  exposants 
impairs. 

Le  second  terme  sera  beaucoup  plus  grand  que  le  premier: 
le   premier  S  est   un  ensemble  de   n  termes,   le  second  yi 

un  ensemble  de '  termes  ;    ces  nombres  de  termes 

2 

sont  respectivement  de  l'ordre  de  n  et  [de  l'ordre  de  w-,  le 
premier  est  négligeable  devant  le  second.  Les  différents 
termes  des  deux  XI  sont  d'ailleurs  par  hypothèse  très  petits 
et  sensiblement  du  même  ordre  de    grandeur.  On  a  d'autre 
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part . 

ou  : 

Le  premier  terme  est  encore  négligeable  devant  le  second, 
et  celui-ci  est  identique  dans  les  deux  expressions. 
Donc,  avec  l'approximation  adoptée  : 

y  =  3M2. 
Valeur  moyenne  de  y^  : 

7=  S^  +  lo  Si^j  ^  +  90  SîTî  yi  ^- 

Calculons  d'autre  part  ISM^  : 

15M3  =  15S  î^f  +  ^-32  (W  ^  i-  90S^  2^  ^. 

Comparons  les  deux  seconds  membres.  Le  premier  S  porte 

sur  n  termes,  le  second  S  sur  n  [n  —  Ij,  le  troisième  S  sur 

n  (n  —  1)  (w  —  2)  ,  ,  ,     1,      1 

— ^ ■  -;  ' -',  ces  nombres  de  termes  sont  de  tordre 

1.2.3 

de  grandeur   de  n,  de  w^,  de  n^,  et  les  deux  premiers  S  sont 

négligeables   vis-à-vis  du   troisième.   Comme  le  terme    qui 

n'est  pas  négligeable  est  le  même  : 

y^  =  15M3. 

4.  Supposons  que  l'erreur  finale  soit  la  résultante  d'un 
très  grand  nombre  d'erreurs  partielles,  indépendantes  les 
unes  des  autres,  et  qu'il  n'y  ait  pas  d'erreurs  systématiques  ; 
supposons  aussi  que  ces  erreurs,  qui  seront  sensiblement  du 
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même  ordre  de  grandeur,  entrent  chacune  pour  une  faible 
part  dans  l'erreur  totale. 

Dans  ce  cas,  l'erreur  résultante  suivra  sensiblement  la  loi 
de  Gauss. 

Telle  est,  il  me  semble,  la  meilleure  raison  à  donner  de  la 
loi  de  Gauss. 

5.  On  en  donne  aussi  une  vérification  a  posteriori,  fon- 
dée en  somme  sur  le  théorème  de  Bernouilli. 

Si  une  certaine  épreuve  peut  donner  naissance  à  plusieurs 
événements  tels  qu'un  seul  d'entre  eux  se  produise  à  la  fois, 
et  si  on  répète  l'épreuve  un  très  grand  nombre  de  fois,  les 
nombres  des  événements  qui  se  produiront  seront  très  sen- 
siblement proportionnels  à  leurs  probabilités. 

On  mesure  un  grand  nombre  de  fois  une  quantité  z  ;  les 
résultats  sont  a?,,  x.^,...  x^,  et  les  erreurs  y^,  y^-.---  Va- 

Si  nous  connaissions  bien  3-,  nous  connaîtrions  bien  y,, 
y^,..yn\  si  nous  comptons  le  nombre  d'erreurs  comprises 
entre  deux  limites  données,  a  et  h,  ce  nombre  sera  propor- 
tionnel à 


'J  a 


On  peut  construire  la  courbe  qui  représente  o  'y,).j 
On  divise  l'axe  des  abscisses  en  un  certain  nombre  de  par- 
ties égales  à  x:  chacun  de  ces  petits  intervalles  est  assez 
grand  pour  que  le  nombre  des  erreurs  dans  cet  intervalle 
soit  grand  ;  au  milieu  de  cet  intervalle,  élevons  une  ordonnée 
proportionnelle  à  ce  nombre  d'erreurs. 

La  courbe  obtenue,  si  la  loi  de  Gauss  est  vraie,  aura  pour 
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=  ^l- 


hx' 


C'est  une  courbe    asymptotique  à  l'axe  des  abscisses  et 
symétrique  par  rapport  à  l'axe  des  ordonnées. 


FiG.  16. 


no(.      fn.*-t)ei 


Ce  résultat  se  vérifie,  paraît-il.  Ainsi  Bessel  a  pu  repré- 
mter  les  résultats   d'un  grand  nombi 
Bradley,  sur  la  déclinaison  d'une  étoile. 


senter  les  résultats   d'un  grand  nombre  d'observations  de 


6.  On  peut  aussi  se  dispenser  de  tracer  une  courbe,  et 
vérifier  par  le  calcul. 

Remarquons,  en  premier  lieu,  que,  si  on  ne  connaît  pas  la 
véritable  grandeur  à  mesurer,  on  adoptera  la  valeur  moyenne 
des  observations  comme  la  représentant. 

Vérifions  par  le  calcul:  la  valeur  moyenne  de  i/^p  serait, 
d'après  la  loi  de  Gauss, 


i-'p  — 


2yQ!        1   . 

p!  '±-1'  hi''' 


celle  de  y'^'i, 


^  q  !  2-'/  h'i 


QUINZIÈME    LEÇON  189 


Éliminons  h 


Cette  relation  doit  être  satisfaite. 

Pour  les  observations  faites,  nous  connaissons  les  erreurs 
yt,  y......  yn.  L'expression 


^y'{^'  +  yV'  +  --\-yV 

doit  être  éo^ale  à 


VyV  -\-yV  -^  •■■-^y''' 


V  /2p  ! 


V 


p'. 


<^ 


celte  vérification  se  fait  également,  paraît-il. 

On  peut  encore  considérer  ?/-p+*.  La  valeur  probable  serait 
nulle  si  Ion  prenait  y  avec  son  signe.  En  ne  considérant  que 
la  valeur  absolue,  on  aurait  comme  valeur  probable,  d'après 
la  loi  de  Gauss, 


-  I        \J  iy''^'  e-^y'  dy- 
>-'  0 


cette  intégrale  eulérienne  n'e«t  pas  nulle. 

Si  on  avait  pris  y  avec  sa  valeur  relative,  on  eût  eu 


sa-' 


qui  est  nulle. 
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7.  Admettons  la  loi  de  Gauss. 

Un  certain  nombre  d'observations  nous  ont  donné  comme 
résultats  de  mesure  x^,x.2,...  sc„.  Il  s'agit  de  savoir  la  valeur 
de  h  et  celle  de  z:  tout  ce  que  nous  connaissons,  c'est  a;,, 
CC.2,...  cc„,  et  de  plus  nous  admettons  que  la  loi  des  erreurs 
est  celle  de  Gauss. 

Posons  : 

OC;  —  z  =  ?/,-. 

Demandons-nous  la  probabilité  pour  que  z  soit  compris 
entre  ^^  et  ^  -|-  dz^  et  pour  que  h  soit  en  même  temps  compris 
entre  h  et  h  -\-  dh. 

C'est  un  problème  de  probabilité  de  cause:  la  cause  incon- 
nue, c'est  le  double  fait  ci-dessus;  l'effet  connu,  c'est  que  n 
observations  ont  donné  x^^  x^,...^  x^. 

En  représentant,  comme  précédemment,  par  ct,-  la  proba- 
bilité  à  priori  de  la  cause  envisagée,  et  par  p,-  la  probabilité 
d'un  événement  qui  s'est  produit  si  l'on  admet  que  la  cause 
a  été  mise  en  jeu,  la  probabilité  a  posteriori  de  la  cause  sera  : 


Ici  : 

cj/  =r  ij;  {z,h)  dz  dhi 

sous  la  forme  la  plus  générale  et  sans  faire  <^  =:  i  :  l'idée 
que  nous  nous  faisons  a  priori  de  l'babileté  de  l'observateur 
doit  influer  sur  la  probabilité  que  nous  attribuons  kh. 

Pi  est  la  probabilité  que  les  observations  ont  donné  des' 
résultats  compris  entre  : 

x^  et  AV,  -}-  dx^,  x^  et  x.2  -\~  dx^  ...,  x^  et  x„  -\-  dx,^. 
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Posons  : 


ou  : 


alors 


et 


n  =  ^  {x^  —  z)  (f  {x^  —  z)  ...  cf  {x„  —  î); 
cp  (Xi  —  z]  =  k/^  e-f^^^i---^ 

Pi   =  II   fte,   <ya7o   ...    dXn^ 

zjiPi    _    Il^}<<^/^^r/;^  dXfdx.2  ...  dx„ 
"    '  '        /  U^izdJi  dx^dx^...  dx,^ 


On  n'intègre  pas  par  rapport  aux  x^  dont  les  différentielles 
disparaissent  haut  et  bas.  Par  rapport  à  z,  on  intégrera  de 
—  X  à  -|-x  ,  et  par  rapport  à  /ï  de  0  à  -j-  ^  • 

8.  n  peut  s'écrire  : 

7A-^ 


si  : 

p  ==  K  -  zY  4-  (x.,  -  zf  +  ...  +  K  -  ^?- 

P  est  un  polynôme  du  second  degré  en  z  qui  atteint  son 
minimum  quand  z  est  la  moyenne  arithmétique  des  quanti- 
tés X  ;  représentons  ce  minimum,  qui  est  positif,  par  wa^  : 
c'est  la  valeur  probable  de  y^. 

Je  pose  : 

Xf  -\-  X.2  -f-  ■  ■.  -\- ^ -i 

y  —  X.  — j 

■^  n 

d'où  : 

dz  =  dy 
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et  : 


Alors 


devient 


Pour  y,  comme  pour  z,  on  intégrera  de  —  oo  à  -|-  oo  . 

9.  Cherchons  la  probabilité,  pour  A  seulement,  d'être  com- 
pris entre  h  oX  h  -\-  dh^  y  ayant  toutes  les  valeurs  possibles. 


dhl  A2g-,ift(j/2+a2)^  ^^ 

'J  —on 


'I  dépendait  de  z  et  A  ;  il  dépend  maintenant  de  y  el  A. 
Restreignons  d'abord  le  problème  en  supposant  toutes  les 
valeurs  de  y  également  probables,  c'est-à-dire  -j^  indépendant 
dey. 

On  a 

Ç'     e-'^ity^-iaîi^^y  _  g-"/-a2  Ç   "^  e-"^'y-  dy  =  g-'''*'  \/—- 

La  probabilité  relative  à  h  seul  devient  alors  : 

11-1 
dh.h  -  e^  ''-^^ 

«^  0 
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10.  Quelle  est  d'alxti'd  lu  valeur  la  plus  probable  de  A? 
Clierelions  le  maximuin  du  numérateur,  puisque  la  probabi- 
lité lui  est  proportionnelle. 

Ce  numérateur  peut  s'écrire  : 

Or  le  maximum  de  ^/A'I>"  ;<  /"a  lieu  en  général  quand  : 

f 
(•t  si  n  est  très  grand,  on  peut  négliger  -  ;  le  maximum  est 

tlonc  atfeint  en  même  temps  (|ue  celui  de  •!>. 

Ici  <&  est  \//'6^ ''*'-;  écrivons  que  la  dérivée  logarithmique 
est  nulle  : 

¥h  -  ^-  -=  ^- 

On  a  ainsi  la  valeur  la  plus  probable  de  Ji. 

On  remarquera  que,  en  supposant  un  nombre  très  grand 
d'observations,  la  fonction  arbitraire  •]/  n'intervient  pas.  Ce 
n'est  pas  étonnant  :  l'hypothèse  que  nous  avions  fondée  a 
priori  sur  le  plus  ou  moins  d'habileté  de  l'observateur  dispa- 
raît devant  le  grand  nombre  de  résultats  que  nous  contrô- 
lons. 

11.  Quelle  est  la  valeur  pi-jbable  de  /^''V  Cette  valeur  pro- 
bable est: 


X 


0 
C.\I.CI:L   l»ES   PROBABn.IÏKS.  13 
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OU  : 


«^  0 


dh 


Si  n  est  très  grand,  nous  savons  vers  quelle  limite  tend  le 
rapport  de  ces  deux  intégrales  ;  c'est  : 


=  K"^ 


/iq  étant  la  valeur  la  plus  probable.  Ainsi  la  valeur  probable 


de  h>'  est  /?o^ 


Cette  conclusion  n'est  vraie  qu'à  la  condition  que  n  soit 
très  grand  et  que  p  soit  fini. 

Faisons  >]/  :=  1  :  nous  arrivons  à  des  intégrales  eulériennes 


'hi'  —  ^^ =-.  -^ — ^  X 

Le  rapport  des  valeurs  asymptotiques  donne  : 

i)  M-''  =  (25 

C3  qui  est  bien  notre  conclusion. 

Mais  si  l'on  ne  suppose  pas  p  fini,  elle  ne  serait  pas  appli- 
cable. Supposons  p  très  grand,  égal  à  ^  par  exemple  : 

r  (p)  ^  pp  e-f  v'2tp 
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Le  second  membre  se  réduit  à  2p  e—P  \J^  (x^)—P. 

On  trouve  donc  pour  la  valeur  moyenne  de  h''  une  expres- 


sion très  différente 


2p  e-p  \/^2  (  2 

—Tzry-         ou 


(l^/v^ 
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1.  Jai  plaidé  de  mon  mieux  jusqu'ici  en  faveur  de  la  loi 
de  Gauss  dont  nous  allons  maintenant  tirer  les  conséquences. 
Peut-être  pourtant  la  cause  n'était-elle  pas  parfaitement 
bonne. 

Il  ne  faudrait  pas  avoir  une  sorte  de  superstition  pour  la 
mélliode  des  moindres  carrés,  à  laquelle  va  nous  conduire  la 
loi  de  Gauss.  Nous  avons  vu  que  l'on  avait  parfois  des  rai- 
sons de  ne  pas  adopter  cette  loi. 

Elle  suppose,  en  elTet,  qu'il  n'y  a  pas  d  erreur  systéma- 
tique, et  il  y  en  a  toujours. 

D'un  autre  côté,  nous  avons  vu  qu'on  est  souvent  conduit 
à  ne  pas  appliquer  le  procédé  de  la  moyenne,  et,  par  exemple, 
à  rejeter  une  observation  qui  présente  avec  toutes  les  autres 
une  divergence  exagérée.  Il  n'en  serait  pas  ainsi  si  la  loi  de 
Gauss  était  toujours  vraie. 

Quel  genre  de  modification  y  aurait-il  dans  ce  cas  à  faire 
subir  à  la  loi  de  Gauss  ?  La  courbe  : 


y=  \J^-^e-i^-^\ 


que  nous  avons   précédemment  tracée,   devrait  être  relevée 
dans  les  parties  éloignées  de  l'axe  des  orilonnées. 

La  loi  de  Gauss  suppose  encore  o  fonction  de  y  seulement, 
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y  étant  égal  k  x  —  z^  tandis  que  ^  peut  dépendre  de  x  et 
de  z. 

Par  exemple,  pour  tenir  compte  de  Xerreur  décimale  nous 
aurions  pu  prendre  : 

ç(y)  =  y/^e-''y^8{a;), 

9  [x]  étant  une  fonction  périodi([ue  de  a;,  de  période  1,  ([ui 
serait  maximum  pour  les  décimales  qu'affectionnent  certains 
observateurs  et  sur  lesquelles  ils  retombent  toujours. 
D'autre  part,  il  y  a  moins  de  chance  d'erreur  si  l'on  tombe 
précisément  sur  une  division  donnée  directement  par  l'ins- 
trument, que  si  on  est  obligé  de  subdiviser  une  de  ces  divi- 
sions au  jugé.  Alors  h  ne  serait  plus  une  constante  mais,  une 
fonction  de  x  qui  aurait  une  période  égale  à  1  ;  la  précision 
serait  plus  grande  quand  x  serait  un  nombre  entier  que 
lorsqu'elle  ne  le  serait  pas  ;  si  même  l'observateur  évalue 
fort  bien  le  dixième,  mais  ne  sait  pas  donner  d'autres  déci- 
males, 6  [x)  sera  rigoureusement  nul  pour  toute  valeur  de  x 
qui  ne  sera  pas  multiple  de  un  dixième. 

2.  Problème  des  erreurs  commises  sur  la  situation 
d'un  point.  —  .\u  lieu  d'une  seule  grandeur  mesurée,  il  arrive 
souvent  qu'on  en  combine  plusieurs,  comme  les  deux  coor- 
données d'un  astre,  etc. 

Je  suppose,  par  exemple,  que,  pour  évaluer  la  situation 
dun  point  dans  un  plan,  on  ait  fait  n  observations,  et  que 
l'on  ait  trouvé  pour  ses  deux  coordonnées  rectangulaires,  x 
et  y,  les  valeurs  : 

a;, y,,  ^2^2  ••■1  ^nl/n' 
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Les  erreurs  commises  sont  : 

oUf  —  X  et  y,  —  y,  072  —  ^  et  y^  —  y,  ...  cc„  —  x  et  y„  —  y. 

Je  vais  poser  : 

x^  =x-\-l^,  y^  =3/4-7],, 


x„  =  «;  +  ^,,,  2/„  =  2/  +  7i„. 

Les  erreurs  commises  sont  ainsi  représentées  par  : 
\^     et  7],,       ^2     6t     ï)2,     ...,     \n     et  Tl^. 

3.  On  peut  se  demander  quelle  est  la  probabilité  pour  que 
les  erreurs  commises  sur  la  première  observation  soient 
comprises  entre  \^  et  ^,  -f-  d\\i    'h\  et  t^^  +  dt^^- 

Soit  : 

cette  probabilité  ;  il  pourrait  se  faire  que  cp  dépende  de  x  et 
de  y,  mais  je  suppose  qu'il  n'en  est  rien,  et  que  cp  dépend 
seulement  des  erreurs. 

Ces  erreurs  peuvent  être  indépendantes  ;  alors  cp  serait 
le  produit  de  deux  autres  fonctions  et  la  probabilité  serait 
représentée  par  : 

mais  je  suppose  encore  que  l'erreur  commise  sur  l'abscisse 
ne  soit  pas  indépendante  de  l'erreur  commise  sur  l'ordonnée. 

Le  raisonnement  est  analogue  à  celui  de  Gauss  dans  le 
cas  d'une  variable.  On  s'appuie  sur  le  postulat  suivant  : 

Si  on  a  fait  un  certain  nombre  d'observations,  on  reporte 
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les  points  observés  sur  un  plan  ;  la  position  la  plus  probable 
est  le  centre  de  gravité  de  ces  points  supposés  de  masse 
égale. 

4.  A  l'exemple  de  Gauss,  nous  admettrons  que  cette 
manière  de  voir  est  légitime.  Quelle  est  la  loi  d'erreurs  qui 
justifie  cette  hypothèse  ? 

Cherchons  la  probabilité  pour  que  les  coordonnées  du 
point  soient  comprises  entre  x  et  x  -\-  dx,  y  et  y  -\-  dy. 

C'est  un  problème  de  probabilité  des  causes  et  il  nous 
faut  chercher  encore 

CT,  est  la  probabilité  a  priori  pour  que  les  coordonnées 
soient  comprises  entre  x  oX  x  -\-  dx,  y  et  y  -\-  dy;  représen- 
tons-la par  : 

Ui  =  -^  (x,  y)  dxdy. 

Pi  est  la  probabilité  pour  que,  si  la  cause  agit,  le  phéno- 
mène observé  se  soit  produit  :  ici,  le  phénomène  observé, 
c'est  que  les  coordonnées  sont  l'une  entre  : 

x^  et  x^  -j-  dx^ ,  x.2  et  x^  -\-  dx.2,  ....,  x„  et  x^  -{-  dx^ ; 

l'autre  entre  : 

y\  et  y^  +  dy^,  y.-,  et  y^  +  dy^,  ...,  y„  et  y„  -f-  dy„. 

Pi  est  le  produit  des  probabilités  relatives  à  chacune  des 
observations. 

Pi  =  o  (?<,  -1<)  <f  (Ç2'  '^2)  ••■  ?  (^/n  'r\n)  d%^d■q^c^^2^Irl2  ■•.  dl^d-q,,. 
Soit  : 

n  =  9{^\^'n{)  9(^2'  '^2)  ■••  «p  i^n,  '<]„)■ 
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Alors  : 

sera  : 

Il■^dxd^/dl^d■fl^dz.2''/■|■^.,  ...  dl„d-f\„ 

^■^dxd^/dl^d■ï\^dl^d■rl.2  ...  d^^dr^,,^ 

l'intégrale  étant  prise  par  rapport  à  a;  et  y,  il  reste  : 

Yl'ifdxdy 
1  U-^dxdy 

Le  dénominateur  est  constant  et  indépendant  de  x  et  de 
y  ;  la  probabilité  est  donc  proportionnelle  au  numérateur. 

5.  Quelle  sera  la  valeur  la  plus  favorable  ?  celle  qui  rend 
maximum  le  numérateur,  11'^.  Or: 

U.  =  (f[x^—x,  y^  —  y)  cp  ix.^  —x,  y.,  —y)  ...  ©  [x,,  —  x,  y„  -  y) 

Quelles  sont  les  valeurs  de  x  et  de  y  qui  rendent  ce  pro- 
duit maximum  ?  D'après  le  postulat,  c'est  la  moyenne  arith- 
métique de  x^,  x.2^...  x„  pour  x,  et  la  moyenne  arithmétique 
de  ?/,,  ?/o, .-,!/"  pour  j/. 

Égalons  les  dérivées  logarithmiques  auN  l'unclioiis  sui- 
vantes : 


d'^ 

>'1i)< 

■^11 

d^ 

•1  ■-  '- 

La  dérivée  logarithmique  de  ll-j;  par  rapport  à  x,  qui  duit 
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s'annuler  pour  le  inaxiniuin,  est  : 

—  F(-n  ■'■h)  —  F  (^2.  '^i')'--  —  ^'  (^/M  'V)  +  0  =  u 
d'où  : 

F  (;,.  •'l,)  +  F  {l,,  r,,)  +  ...  +  F  i,;,,,  7i„)  =  0. 

La  dérivée  logarithmiciue  par  rapport  à  y  conduirait  à  : 

Ces  deux  relations  devront  être  vériliées  foutes  les  l'ois  que 
l'on  aura  : 

^1  +  x-.-h  ■■■  +  •'»'/.  =  "'^^ 
Vi  +  l/-2-{-  •  ■  +y.<  =  ''^^ 

c'est-à-dire  : 

;<  +  Ç^  +  ■  ■  +  ^.  =  O' 

6.  Il  s'agit  de  déterminer  les  fonctions  o  et  i  de  telle  façon 
que  les  deux  systèmes  d'équations  soient  compatibles. 

DifTérentions  ces  deux  systèmes,  en  regardant  oc  et  y 
comme  constants,  et  en  faisant  varier  ;^,  th,  l^^  "^î---  '"'  "l"- 
La  dérivée  de  0  et  de  O^,,  dans  le  second  membre,  sera 
nulle,  puisque  6  et  0^,  ne  dépendent  pas  de  ces  quantités. 

J'appelle  F,  et  F?  les  fonctions  suivantes  : 

F/  =  Ff;,-,Y,/), 
1  (    —  i  0  \""i  M'y* 

1^0  premier  système  devient  : 

dF^  +  c/F.  +  .  .  +  clF,,  =  o, 
f/FV +r/F !!+...  4-  c/F'' =  o, 
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et  le  second  système  est  : 

dl.^  -^  dl.^  -\~  ...  -\-  d\.^   =  o, 

Tels  sont  les  deux  systèmes  qui  doivent  être  équivalents. 
Les  deux  premières  équations  doivent  être  une  combinai- 
son des  deux  dernières;  nous  devons  avoir  identiquement: 

dF,  +  ^F2  +  --i-dF, 

=  Adl,  4-  Bc^rl,  +  Ac/Ho  +  Bd^^.2-]-  ...  -f  Ml„  +  Bdy^^. 

Identifions  les  deux  membres  : 


rfF,       dF^ 

dF„ 

^-  dl,-  dl,  -  •• 

d\n 

^        rfF,        dF^ 

dF„ 

d-t\n 

A  ne  devrait  dépendre   que  de  \,   et  de  -t^,   puisqu'il  est 

dF 

égal  à  -jr'\  il  devrait  aussi  ne  dépendre  que  de  \^  et  de  'r\^ 
ttK{ 

.1      .  '     1  «  dF^      ^ 
puisqu  il  est  égal  a  -z^ ,  etc. 

Donc  A   et  B  sont  des  constantes  :   F\   est  une  fonction 
linéaire  de  ^|  et  de  t,,. 

De  même  Fy  est  une  fonction  linéaire  de  ^,  et  de  t)^. 
J'ajoute  que,  en  représentant  F,  par: 

F^  =-  M,  +  Bvi,  -h  C, 

la  constante  d'intégration  C  est  nulle. 

En  effet,  si  je   remplace  F^,  F^...   F„  par  leurs  valeurs,, 
j'arrive  à  : 

A  (^.    +  l,  +   •••    +  In)  +  B   l-^,   -f  V,2  +  ...  +-^„)  +^C=  9. 
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Celte  équation  doit  être  satisfaite  toutes  les  fois  que  : 

^(    +  ^2   +   ■••   +1.  =  O, 
'Il  +  '12  +  •••   +   'f\n  =   0. 

Donc: 

nC  =  6, 

et  comme  6  est  indépendant  de  n, 

0  =  0,  C  =  0. 

Il  en  résulte  que  (|/  est  une  constante. 

Pour  que  la  théorie  de  Gauss  soit  applicable,  il  faut  que 
l'on  n'ait  aucune  idée  a  priori  sur  la  valeur  de  la  quantité 
cherchée. 

On  aurait  de  même  : 

D'ailleurs  B  =  D,  car  : 

et  Ton  a  : 

di\f        dl^ 

en  vertu  de  la  définition  de  F  et  de  F^. 
On  arrive  enfin  à  : 

G  étant  une  constante  que  nous  écrirons  LH. 
Le  polynôme  A;f  +  2B;,7i,  +  Er.f  doit  être  négatif,  car 
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une  erreur    infiniment  grande  doit    avoir   une    probabilité 
nulle  :  représentons-le  par  —  P. 

Lcp  =  -P+  LH; 


d'où: 

L'intégrale 


? 


Ee 


jj  '^dq^d■fl^ 


doit  être  égale  à  l'unité  pour  toutes  les  valeurs  possibles  de 
X  et  de  y. 

7.  Ce  raisonnement  donnerait  prise  aux  mêmes  objections 
que  le  raisonnement  de  Gauss.  Admettons  cette  loi. 
On  peut  construire  les  courbes  : 

P  =  constante, 

en  plaçant  l'origine  au  point  visé,  c'est-à-dire  à  très  peu  près 
le  point  moyen.  Le  problème  est  analogue  à  celui  du  tir  à 
la  cible. 

Les  points  se  répartissent  conformément  à  la  loi  de  Gauss 

généralisée. 

Les  courbes  P  =  const.  se- 
ront des  ellipses  concentriques 
ayant  les  mêmes  directions 
d'axes. 

Considérons  Tune  de  ces  el- 
lipses :  je  mène  par  O  plusieurs 
droites  qui  partagent  le  plan 
en  secteurs,  1,  2,  3,  4. 
Soit  s^  la  partie  inférieure  à  l'ellipse  du  premier  secteur, 
S,  la  partie  extérieure. 

S'il  y  a  un  très  grand  nombre  de  points  de  chute,  ils  se 


FiG.  n. 
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répartiront  à  peu  près  proportionnellement  à  leurs  probabi- 
lités. Dans*,  il  y  aura  «,  points,  dans  S^  il  y  en  aura  N,.  Le 
théorème  qui  résulte  inimédialement  de  la  formule  est  le 

suivant  : 

n,   _    ii.,  ng  n^ 

N,  ^  n:  -  N.  -  \ 

Dans  chaque  secteur,  il  y  a  le  même  rapport  entre  le 
nombre  des  points  intérieurs  et  le  nombre  des  points  exté- 
rieurs à  l'ellipse. 

8.  Si  les  observations  sont  indépendantes,  cp  est  le  produit 
de  deux  fonctions.  P  sera  alors  la  somme  de  deux  fonctions 
dépendant  chacune  d'une  seule  variable,  donc  le  terme  en 
If  ■q^  disparaît. 

Cela  veut  dire  que  les  ellipses  ont  leurs  axes  parallèles 
aux  axes  de  coordonnées. 

Pour  que  l'écart  entre  le  point  visé  et  le  point  observé  soit 
indépendant  de  la  direction,  l'ellipse  devra  se  réduire  à  un 
cercle. 

On  pourrait  encore  regarder  comme  indépendantes  l'er- 
reur en  abscisse  et  l'erreur  en  rayon  vecteur. 

C'est  là-dessus  qu'était  basée  une  démonstration  de  la  loi 
de  Gauss,  déjà  citée,  et  dépourvue  de  valeur. 

9.  La  méthode  des  moindres  carrés  sert  à  déterminer 
des  quantités  ?<,,  u^...,  iip  qu'on  ne  peut  mesurer  directe- 
ment, mais  dont  on  mesure  certaines  fonctions  ^,,  z^...,  z„. 

2-,   ^=   F,    (m,,    ^2    "M    «/Oi 

^•2  =  l'a  ("(•  "2  •••>  "p.'i 
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Pour  les  mesures  de  ^, ,  z.^...,  -s-„,  n  observations  ont  donné 
Xf,  X.2  ...,  x„  ;  on  a  commis  des  erreurs.  Sur  Zi  Terreur  t/,- 
est  : 

IJi   =  Xi  —   Zf. 

Le  problème  ne  se  pose  que  pour  n  >  |;,  car,  pour  n  =p, 
le  système  d'équations  donne  une  solution;  pour  n  <  p,  il 
n'y  a  pas  assez  d'équations,  et  le  problème  est  indéterminé. 

Pour  n  >  p,  il  y  a  trop  d'équations  :  quelles  sont  alors  les 
quantités  les  plus  convenables  à  prendre  pour  les  u  ? 

Eliminons  les  j^  quantités  ic  ;  on  est  conduit  an  —  p 
équations  : 

6,-(^,,  2-0  ...,  z,,)  =  o,  i  =  1,  2,  ...,  n  —  2J. 

Ce  sont  les  équations  de  condition. 

On  a  parfois  avantage  à  prendre  les  équations  de  condi- 
tion sous  cette  forme. 

Parfois  il  est  préférable  d'exprimer  les  z  en  fonction 
des  M, 

Nous  traiterons  un  exemple  avec  l'une  et  l'autre  méthode  : 
le  premier  relatif  aux  planètes,  le  second  à  un  problème  de 
triangulation. 
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1.  La  première  partie  delà  méthode  des  moindres  carrés, 
que  nous  abordons  immédiatement,  est  de  déterminer  les 
valeurs  les  plus  convenables  des  k.  Dans  une  deuxième 
partie,  nous  nous  occuperons  de  l'erreur  commise. 

La  cause  inconnue  est  que  les  quantités  u  soient  comprises 
entre  certaines  limites  ;  les  quantités  observées  cOi  sont  elles- 
mêmes  comprises  entre  certaines  limites.  Appliquons  une 
fois  de  plus  la  formule  : 

rsi  est  la  probabilité  a  priori  pour  que  la  cause  ait  été  mise 
en  jeu,  c'est-à-dire  ici  pour  que  les  quantités  u  soient  com- 
prises entre  u^  et  ll^  -\-dl'.^,  ii.,  et  Uo  +  du^,  ...,  Upetitp  -j-  dup. 
Cette  probabilité  peut  se  représenter  par  : 

^  (m^,  t<2,  ...,  Up)  dUfdi(.2  ...  diip. 

•l  aura  des  formes  variées  suivant  l'idée  qu'on  se  fera  a  priori 
des  quantités  u  :  il  y  a  là  un  très  grand  degré  d'arbitraire. 

Pi  est  la  probabilité  pour  que  xi  soit  comprise  entre  Xi  et 
Xi  -\-  dxj,  en  supposant  que  les  h  aient  eu  les  valeurs  que  nous 
leur  avons  attribuées,  z^^  So'---'  ^"  ^t^nt  données  en  fonction 
des  u,  la  probabilité  de  Terreur  commise  sur  chacune  d'elles 
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sera  respectivement  : 

?i  (i/i)  d^J^  —  cf  (u.-,  —  z^)  dx^, 


La  probabilité  jj,  que  nous  cherchons  est  celle  pour 
laquelle  toutes  ces  circonstances  se  produisent  à  la  fois;  c'est 
une  probabilité  composée: 

Vi  =  ?i  [Vs)  Î2  {y-2)  •  ■  ?«  {yn)  dy^dy^_  ...  dij,,. 
J'abrège  un  peu  l'écriture  en  posant  : 

da^du^  ...  dUf,  =  (/w, 
et  d'autre  part  : 

?i  (2/1)  ?2(y2)  •••  î«  iyn)  ~  n 

dy^dy.^  •••  '^y-t  =-  dx^dx.2  ...  c^^„  =  dw  . 
Alors  PjTj,  est  égal  à  : 

et  : 


'''^'        Jn,l;rfa,c/o/ 


Comme  on  n'intègre  que  par  rapport  à  (/co,  d^  disparaît. 

Telle  est  la  probabilité  qu'il  s'agit  de  connaître,  à  savoir 
la  probabilité  a  posteriori  pour  que  ?</  soit  compris  entre  m, 
et  lit  -\-  dui.  Cette  probabilité,  puisque  le  dénominateur  est 
constant,  est  proportionnelle  à  II,  fonction  des  /(,  et  à  >]/  dm 
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qui  représente  la  probabilité  a  priori  et  qui  est  aussi  fonc- 
tion des  u. 

2.  Pour  obtenir  la  valeur  la  plus  probable  des  quantités  m, 
il  faut  chercher  le  maximum  Je  n  J/  diù. 

L'hypothèse  la  plus  simple  sur  •{/  est  -]/  =  !:  reste  à  déter- 
miner le  maximum  de  IL 

L'hypothèse  la  plus  simple  sur  les  cp  est  que  les  erreurs 
suivent  la  loi  de  Gauss. 

Alors  : 

n  sera  maximum  quand  la  parenthèse  sera  minimum, 
c'est-à-dire  : 

^yf  +^->i/i  +  ...  -\-Kyl. 

C'est  une  fonction  connue  des  u:  les  quantités  h^^  h.y,...^ 
h„  représentent  les  poids  des  observations,  et  ce  qu'il  faut 
rendre  minimum,  c'est  la  somme  des  carrés  des  erreurs  com- 
mises, chaque  carré  étant  multiplié  par  le  poids  de  l'obser- 
vation correspondante. 

3.  On  arriverait  au  même  résultat  sans  admettre  la  loi  de 
Gauss,  pourvu  que  l'on  suppose  les  erreurs  accidentelles 
petites  et  les  erreurs  systématiques  nulles. 

En  effet,  supposons  les  quantités  y  très  petites  :  quelle  que 
soit  la  forme  attribuée  aux  fonctions  tp,  nous  serons  amenés 
à  quelque  chose  d'analogue.  Il  s'agit  de  rendre  maximum  le 
produit  des  »,. 

CALCUL    DES    PROBABILITÉS.  14 


210  GVLCUL    DES    PROBABILITÉS 

Je   suppose   cp,-  paire,  et  je  développe  par  la  formule   de 
Taylor  Lip^  changé  de  signe. 

—  Lcp.  (2/1)  =  «I  +  b^y'\  +  c^y\  -f  ... 

—  Lcpo  {^J.^  =  «2  +  ^2^2  +  c-il/l  -\-  •■■ 


La   somme  des   logarithmes  changés  de   signe  doit  être 
minimum,  c'est-à-dire: 

Sa,- +  S%?  +  Se,?//  -I-  ... 

Je  différentie  par  rapport  à  «/,  : 


-'*lï  +  -^-'âr  +  - 


Comme  les  y,-  sont  supposés  très  petits,  on  peut  en  négli- 

'  ger  les  puissances  supérieures,  et  tout  se  passe  comme  si  nous 

avions  à  rendre   minimum  S  h^yj.  En  admettant  donc  que 

la  loi  de  Gauss  ne  soit  pas  vraie,  la  véritable  loi  n'en  sera  pas 

très  différente  dans  l'intervalle  utile. 

De  deux  choses  l'une,  ou  bien  les  observations  sont  sensi- 
blement concordantes,  et,  comme  nons  venons  de  le  voir,  la 
méthode  des  moindres  carrés  sera  applicable;  ou  bien,  elles 
ne  sont  pas  sensiblement  concordantes,  et  dans  ce  cas  les 
observations  ne  vaudront  rien  et  il  n'y  aura  rien  à  en  tirer. 

4.  Nous  ne  saurions  cependant  nous  contenter  du  raisonne- 
ment qui  précède,  car  ce  que  nous  voulons  obtenir,  c'est  la 
valeur  probable  des  ii  (et  non  la  plus  probable). 

La  probabilité  pour  que  x  soit  compris  entre  x  ei  x  -\-  dx 
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étant  3.  [or,  dx,  la  valeur  la  plus  probable  de  x  est  celle  qui 
rend  maximum  3»  {x)  dx. 

La  valeur  probable  de  x  est  /  a;s  [x]  dx. 

La   valeur   probable    de    ii   étant  u^,  la  valeur  probable 
de  la  fonction  z. 

Z   =   M-, 

ne  sera  pas  v.\. 

Mais  si  les  z  sont  fondions  linéaires  des    u,  les    valeurs 
probables  des  z  correspondent  aux  valeurs  probables  des  w. 

Zi  =  Ai^^(^  -f  \,.,u.,  -f-  ...  -f-  A,f,i(p  -\-  B,-. 

Cnrfto  représente  la  probabilité  pour  que  la  i"  quantité  w, 
soit  comprise  entre  u,  et  Ui  -j-  di',. 
Soit  t4  la  valeur  probable  de  u/,-  : 

ul  =  feu  n/rho. 
La  valeur  probable  de  Zi,  soit  z'I,  sera  : 

-■;  =j"cn  A,,'.',  -f  ^,2>'2  -f-  •••  4-  A,y/^  +  b,)  do,, 


ou 


^«  =  A,,  feu  M,c/o)  +  \i.,fcn  v.,dL.i  -f  ... 

-f  X,,fCllu,,di.o  +  B,yClIr/(o, 

et  comme  fCïlilo  est  la  valeur  probable  de  Tunité,  c'est-à- 
dire  1, 

z^  =  A,,i^?  -f-  A,,k5  +  •••  +  '^'P  K  +  B. 
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5.  Je  vais  supposer  d'une  part  <]/  constant  ;  d'autre  part 
que  la  loi  des  erreurs  est  celle  de  Gauss  ;  enfin  que  les  z  sont 
liées  aux  u  par  des  relations  linéaires. 

Je  vais  établir  que  la  valeur  probable  des  u  est  celle  qui 
est  donnée  par  la  méthode  des  moindres  carrés. 

Le  produit  pi  rsi  atteint  son  maximum  quand  la  fonction  P  : 

est  minimum. 

Soient  m?,  u^,  ...  u^  les  valeurs  des  ii  qui  rendent  cette 
expression  minimum.  Ces  valeurs  seront  aussi,  comme  nous 
allons  le  voir,  les  valeurs  probables  des  u. 

On  a: 

n  =  Ce-p. 

La  valeur  probable  de  u^.  est  : 


Hdu) 


/  UU/cdd) 

ndoi  fndoi 

Il  faut  démontrer  que  : 

,,0    ^ 

fndu> 

c'est-à-dire: 

/  n   {U;r  Ul)  diO  =  O. 

On  a: 
Xi  est  connu,  3-,-  est  du  premier  deg^ré  par  rapport  aux  u  :  P 
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est  donc  un  polynôme  du  second  degré  par  rapport  aux  u. 
P  atteint  son  minimum  quand: 

t(^   =  mJ,  t<2  =   t<2'  •>  Myt  =  M°,  ... 

Cela  veut  dire  que  : 

P  =  P,  +  P2. 

P2    étant  un  polynôme  homogène  et   du  second  degré  par 
rapport  à  (î<,  —  w?),    {u.^—ui),    ...,    (w/t  —  m^j,  ...  ;  et  P^ 
étant  la  valeur  de  ce  minimum. 
Nous  avons  à  démontrer  que  : 


/ 


Ce— Po  e— P-'  (u/.  —  ut)  doi  =  o. 


Ce— ^0  e— P:i  est  une  fonction  paire  des  quantités  u,-  —  w?, 
w^.  —  ?<°  est  une  fonction  impaire.  Comme  l'intégrale  est 
prise  de  —  00  à  -{-  00  ,  elle  est  bien  nulle. 

Ainsi  ces  valeurs  des  u  sont  non  seulement  les  valeurs  les 
plus  probables,  mais  les  valeurs  probables. 

6.  En  général,  en  est-il  ainsi  ? 

Si  les  opérations  sont  sensiblement  concordantes,  les 
erreurs  sont  petites,  et  tout  se  passera  comme  avec  la  loi  de 
Gauss. 

Quelle  que  soit  la  forme  des  fonctions  F,  si  le  champ  de 
la  variation  des  u  est  très  restreint,  nous  pourrons  regarder 
les  z  comme  linéaires. 

Pour  cette  même  raison,  c'est-à-dire  si  le  champ  où  peuvent 
varier  les  u  est  très  restreint,  la  fonction  •]/,  qui  était  d'abord 
si  arbitraire,  peut  être  regardée  comme  constante. 

C'est  grâce  à  cet  ensemble  de  circonstances  que  la  mé- 


214  CALCUL    DES    PROBABILITES 

thode  des  moindres  carrés  peut  être  considérée  comme  appli- 
cable, toutes  les  fois  que  les  observations  sont  sensiblement 
concordantes  et  dénuées  d'erreurs  systématiques. 

7.  Ceci  posé,  voyons  comment  les  calculs  doivent  être 
dirigés. 

Nous  connaissons  les  fonctions  z  des  u  :  ceux-ci  sont  au 
nombre  de  p,  et  un  nombre  d'observations  w,  plus  grand  que 
p,  nous  adonné  pour  z^,  ^21-  •'  -^"  ^^°  valeurs  x^,  x.-,,...,  x„. 

Il  y  a  plus  d'équations  que  d'inconnues  ;  cherchons  la  meil- 
leure manière  d'y  satisfaire  d'une  façon  approchée. 

Une  première  approximation  donnera  M,,  u^^,...,  Up.  Sup- 
posons qu'elle  soit  assez  bonne  pour  qu'on  puisse  négliger 
le  carré  de  l'erreur  commise  :  soit  bi  cette  première  approxi- 
mation pour  Ui  : 

M,.  =  bi  -f-  Vi. 

Si  nous  développons  les  Zi  suivant  les  puissances  crois- 
santes des  Vi,  d'après  la  formule  de  Taylor,  et  en  négligeant 
les  carrés  des  vi, 

z,  =  A^v,  +  A,2V2  +...-]-  KpVp  H-  B,-; 

on  aura  de  la  sorte  n  équations  qui  sont  devenues  linéaires. 
Il  faut  rendre  minimum  : 

Écrivons  que  les  p  dérivées  par  rapport  aux  p  quantités 
v^,  «2,  ...  Vp  sont  nulles. 


Or: 

dz 


dvk 
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il  reste  : 

:£,/i,A,;,{z,-  —  Xi)   =   O. 

8.  Nous  sommes  donc  conduits  à  la  règle  suivante  : 
J'écris  les  équations  ci-dessous  qui  ne  sont  qu'approchées  : 


a',  —  B,   =  A,, y,   -f  A,.,»;,  +  ...  -|-  A„/tv, 

^2   —    1^2    —    ^^2l"(     +    Ao^jt^    +    ...    -f    A.,pVp, 


/^,A,, 
/.,A.„ 


x„  —  B,,    =  ^„^v^  -f  A,.,v.,  -\-  ...  4-  A„,,t>.       h„A„^ 

Non  seulement  ces  équations  sont  approchées,  mais  elles 
sont  inconq)atibles  puisque  >i  >  p. 

Je  multiplie  les  deux  membres  de  la  première  par  A, A,,  ; 
ceux  de  la  seconde  par  A.^Ao,  ;  ...  ceux  de  la  w*  par  /*„A„,  ; 
et  j'ajoute  les  résultats  membre  à  membre. 

J'obtiens  ainsi  une  première  équation  linéaire  en  a;  et  u  ; 
je  me  suis  servi  des  coefficients 

où  j'ai  fait  /e  =  1.  Si  je  fais  k  égal  successivement  à  2,  ...,  j3, 
j'obtiendrai  les  nouvelles  suites  de  coefficients  : 

^,A,o,  /ioA.^,,     ...     A„A,,2 

7?,A,p,  h.,A.,,,,     ...     h,,A„,, 

et  par  conséquent  p  équations  linéaires  pour  les  v. 
La  résolution  de  ce  système  répond  au  problème. 

9.  Je  dirige  le  calcul  autrement. 
J'ai  n  fonctions  Zi  de  «, ,  u^ ,  Hp. 

'  Zi  —  F,u<,,  n.^,  ...  Up). 
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Je  puis  éliminer  les  u  ;  d'où  n  —  p  équations,  qui  sont  les 
équations  de  condition. 

cp,    (3-,,    2-0,    ...   Z„)   =0, 


?9(-2'lî   -2'2'  •••   ^n)  =   O, 


en  posant  q  =  n  —  p. 

Je  puis  développer  les  équations  de  condition,  en  négli- 
geant les  termes  du  second  degré  par  rapport  aux  y  si  les 
observations  sont  suffisamment  concordantes. 

Ah2/i  4-  A, 2^2  4-  •••  -f  A,„y„  =  Bp 
^2)2/1  H-  Aa23/2  +  •••  +  A2«2/«  =  ^2» 


A^i2/i  +  A922/2+  •••  +  Aç,,^//»  =  Bç. 

Quelle  est  la  meilleure  manière  de  satisfaire  à  ces  équa- 
tions de  condition  ?  C'est  en  rendant  minimum 

Donc  : 

^hiVidyi  =  o. 

10.  Il  faut  observer  querf^/, ,  dy^-,  ...,  dy,,  ne  sont  pas  indé- 
pendantes :  elles  sont  liées  par  les  relations  qu'on  obtient 
en  différentiant  les  équations  de  condition. 

Ces  équations  de  condition  ont  pour  forme  générale: 

d'où  : 

Hkuidyi  ■=  0. 
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Les  relations  qui  lient  c/j/,,  dy^.  ...  dy„  sont  donc  : 

SA,,r/y,   =  O, 

SA„rf?/,  =  o, 


^^.|idyi  =  o  ; 
et  : 

^hiyidyi  =  o 

doit  être  une  conséquence  de  ces  q  équations. 

On  devra  donc  avoir  (les  e  étant  des  coefficients  indéter- 
minés) : 

hiyi  =  e,A,,-  -f  e.Aa,  +  •••-!-  e^A,,-. 

On  déterminera  les  e  en  transportant  dans  les  équations 
de  condition  la  valeur  des  ?/,•  en  fonction  des  £ ,  la  première 
deviendra  : 


+  ^'  [^.A,2  +  V^2-2  +  •••  +  ^AJ  +  -  =  B, 


et  l'on  aura  de  cette  manière  q  équations  pour  déterminer 
les  e. 

Telle  est  la  seconde  solution  du  problème. 

11.  Prenons  deux  variables  et  quatre  observations. 
Les  deux  équations  de  condition  seront  : 

Ay,  +  By,  +  Cl/3  +  Dy,  =..  H 

A>, -fB>2  +  CV3  +  D-.v,  =  H'. 
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Je  suppose  mêmes  poids  /?^,  h.^^  //g,  A,. 

y,  =  Ae,  -f-  A'£2, 
y,  =  Bp.,  +  B  s„ 

J/:?  =  Ci,  -f-  Csa, 
y,.  =  Ds,  +  De,. 

Les  équations  en  s,  après  la  substitution  des  y  dans  les 
équations  de  condition,  seront  : 

(SA*-')  £,  +  (SAA'j  £2  =  H 
(SAAj  E,  +  (SA'^')  £2  =  H'. 

Des  deux  méthodes  indiquées,  Tune  est  plus  avantageuse 
que  l'autre  suivant  les  circonstances. 

La  difficulté  est  la  résolution  de  nombreuses  équations 
linéaires;  le  but  à  atteindre  est  d'en  avoir  le  moins  possible. 

Dans  la  première  méthode,  il  y  a  /)  équations;  dans  la 
seconde,  il  y  en  a  q.  On  emploiera  donc  la  première  si  n  est 
plus  grand  que  2/),  la  seconde  si  n  est  plus  petit  que  2p. 
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1.  Nous  avons  cherché  à  rendre  minimum 

où  hi  est  le  poids  de  lobservaiion  i. 

On  peut  ramener  le  problème  au  cas  où  tous  les  poids 
sont  égaux.  Posons 

Zl  =  Zi  \hi  =  \'A,F,  (m,.  Mo,   ...   Up) 

et  : 

Xi  =  Xi  V  '^/ 1 
alors  : 

h,  Ui  -  x,)^  =  ishiZi  —  sjhixif  =  (z/  -  xr\ 

et  on  a  à  rendre  minimum  une  expression  telle  que  : 


2.  Nous  avons  vu  que  l'on  pouvait  diriger  les  calculs  de 
deux  manières.  Voici  un  exemple  de  chacune. 

Premier  exemple.  —  On  observe  un  point  M  d'un  certain 
nombre  de  stations  S,,  S.,,  Sg,  ....  dont  la  position  est  par- 
faitement connue  ;  on  mesure  l'angle  de  ?>IS4,  par  exemple, 
avec  une  direction  fixe  MSq.  en  dautres  termes  l'azimut 
de  M,  soit  ^,  ;  et  ainsi  de  suite. 
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Quelle  est  la  position  la  plus  probable  du  point  M  d'après 
ces  visées? 

Soient  r»,  y  les  coordonnées  de  M;  «,-,  bi  celles  de  S,-;  <{»/ 
l'angle  de  MS,-  avec  MS^  pris  comme  axe  des  abscisses. 

s. 


cp,  =  arc  tg  ; 


y  —  bj 


a, 


FiG.  18. 


Les  équations  en  <p/ 
sont,  en  général,  in- 
compatibles, les  lignes 
de  visées  ne  passant 
pas  exactement  par  M 
et  formant  autour  de 
ce  point  un  petit  poly- 
gone. 
Un  point  quelconque  pris  à  l'intérieur  de  ce  polygone 
sera  une  première  approximation,  M,,  (.r^,  y^).  Je  pose 

X  --  x^  -\r  \, 

y  =  2/0  +  ^  ; 

^  et  7)   seront  de   très  petites 
quantités. 
Posons  : 


<?'• 


<P?  -f  ^i- 


(Dans  le  cas  de  la  figure  19, 
0),  serait  négatif) . 
D'ailleurs  : 


Fio.  19. 


Va  b: 

cpf  =arctg^^^ •'• 
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Développons  cp,  suivant  les  puissances  croissantes  de  ;  et  tj, 
en  nous  arrêtant  aux  termes  du  premier  degré. 

^''  "  ^'   ^  ^,^^0  -  «<)^  4-  (3/0  -  b,f 


Soit  : 


A         _  -Vo  -  ^i 


(^0  —  ^ij^  +  (i/û  —  *<)' 


Alors 


w,-  =  ï/,-  —  9?  =  A,;  -}-  B,-/]. 
La  valeur  observée  de  a.,  est  -]/,•  : 

^l'.-  =  ??  +  en 

e,  sera  la  valeur  observée  de  w,-.  Les  équations  que  donnent 
les  observations  seraient  les  suivantes  : 

£,-  =    A,Ç   +    B/T). 

Ces  équations  sont,  en  général,  incompatibles,  parce  que 
les  observations  ne  sont  pas  exactes  ;  il  faut  choisir  ç  et  tj  de 
façon  que 

S  (A,i  +  B,y,  -  s,)* 
soit  minimum. 

Je  difïérentie  par  rapport  à  ;  et  à  t)  : 

SA,-  (A,-;  +  Brn  —  £,)  =  o, 

SB,(A,?  +  B,-ri-£,)  =  o; 

d'où  deux  équations  linéaires  pour  déterminer  ç  et  t)  : 

^2A^  +  riSAB  =  SAe, 
^,SAB  -f  TiSB»  =  SBs. 
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3.  Deuxième  exemple.  —  Supposons  qu'on  ait  mesuré 
neuf  angles  :  soient  zi  les  valeurs  de  ces  angles,  Xi  les  valeurs 
observées,  y,-  les  erreurs.  Imaginons- qu'on  ait  entre  ces 
neuf  angles  les  quatre  relations  de  condition  : 

^1     +    2-2    +  -S'a   =  TT, 

^4  +  's  +  -n  =  ^^ 

-^7    +  ^8  H-  ^9    =  ^1 
^3    +   ^4  +   ^'   =   2^- 

h^  étant  une  quantité  très  petite  donnée  par  l'observation, 
l'excès  sur  deux  droits  de  la  somme  des  angles  observés, 

d'où  : 

y^  -\-y-2  +  y-i^  ^h- 

De  même  : 

2/4  +  2/3  H-  3/6  =  ^'•.• 
y^  +  .Vs  +  2/9  =  -^^3- 

La  quatrième  équation  de  condition  exprime: 

2/3  +  .Vi  +2/7  ~  '^i- 
Il  s'agit  de  déterminer  les  y  de  façon  que  la  somme 

^y? 

soit  minimum. 

levais  introduire  quatre  quantités  auxiliaires,  e,,  £3,  Sg,  e^, 
correspondant  aux  quatre  quantités  7?,,  7? 2,  7?3,  h^  Ainsi, 
pour  2/3,  je  me  servirai  du  coefficient  de  7/^  dans  la  première 
équation,  où  il  est  1,  puis  dans  la  deuxième,  puis  dans  la 
troisième,  où  il  est  0,  puis  dans  la  quatrième,  où  il  est  1. 

y-i  =  ^i  -\-  u- 
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On  trouve  de  même  : 

y^  =  y6  =  ^2' 
y»  =  y-j  =  ^3' 

2/7  =  S;,  -h  £.;• 
Pour  déterminer  les  s,  je  remplace  les  y  par  leur  valeur  : 

3e,  +    £^  =  ^,, 

3^2  -f-      ^4    =   ^2' 

3e3  +     e^  =  /?3, 

^1    +   '2   +   ^3  +   '^U   =   ^4"' 


d'où 


et  : 


3   (^4   +   ^2  +   ^3^   H-  3e.,   =   /',    +  '^2   +  ^'3> 

6e,  =  3/i^  —  /?,  —  Ao  —  ^3' 

et  ainsi  de  suite. 

Ce  procédé  est  ici  plus  commode  que  l'autre.  Il  y  a  neuf 
angles  et  quatre  équations  de  condition,  d'où  cinq  arbi- 
traires ;  nous  avons  eu  à  résoudre  quatre  équations  à  (juatre 
inconnues,  et  par  l'autre  méthode  nous  aurions  eu  cinq  équa- 
tions à  cinq  inconnues. 

4.  Autre  exemple.  —  On  a  visé  un  certain  nombre  de 
points  M,,  Mj,...,  M„  (}ui  ne  sont  pas  en  ligne  droite  et  qui 
devraient  l'être  :  quelle  est  la  droite  la  plus  probable? 

Il  s'agit  de  déterminer  n  nouveaux  points  en  ligne  droite, 
de  telle  façon  que  la  somme  des  carrés  des  erreurs  soit  mi- 
nimum. 
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L'erreur  est  double  :  elle  porte  sur  l'abscisse  et  elle  porte 
sur  l'ordonnée.  Si  je  suppose  que  la  probabilité  d'une  erreur 
sur  l'abscisse  soit  la  même  que  la  probabilité  d'une  erreur 
sur  l'ordonnée,  la  somme  des  carrés  des  erreurs  sur  l'abscisse 
et  sur   l'ordonnée   sera   la    somme  de  quantités  telles  que 


Nous  avons  besoin,  en  réalité,  non  des  points  P,-,  mais  de 
la  droite  D  qui  passe  par  les  points  P/  :  je  dis  que  MjP,-  doit 
être  perpendiculaire  à  D. 

Si  elle  ne  l'était  pas,  soit  M,-  P,  cette  perpendiculaire;  en 
remplaçant  M;  P,  par  M;  P'-,  je  diminuerai  la  somme  qu'il 
s'agit  de  rendre  minimum,  et  par  conséquent  elle  n'était  pas 
minimum. 

Je  ne  m'occupe  plus  des  P  :  je  vais  chercher  une  droite 
telle  que  la  somme  des  carrés  des  distances  des  points  M,-  à 
cette  droite  soit  minimum. 

C'est  le  moment  d'inertie  des  points  par  rapport  à  cette 
droite  qu'il  faut  rendre  minimum,  en  supposant  que  chacun 
des  points  ait  été  affecté  d'une  masse  égale  à  1. 

Comme  première  propriété,  la  droite  passe  par  le  centre 
de  gravité.  Si  on  fait  tourner  la  droite,  on  sait  que  le  mo- 
ment d'inertie  varie  suivant  une  loi  très  simple,  qui  amène 
à  la  définition  de  l'ellipsoïde  d'inertie.  Ici,  cet  ellipsoïde 
serait  infiniment  aplati,  puisque  les  points  sont  dans  un  plan  ; 
la  droite  est  donc  le  grand  axe  de  l'ellipse  à  laquelle  il  se 
réduit.  Cette  ellipse  d'inertie  serait  d'ailleurs  une  ellipse  très 
allongée,  puisque  les  points  sont  sensiblement  en  ligne 
droite. 

5.  Dans  le  cas  où  l'on  vise  un  point  dans  un  plan,  la  pro- 


DIX-HUITIÈME    LEÇON  225 

habilité  d'une  erreur  eu  abscisse  peut  u'ètre  pas  la  même  que 
celle  d'une  erreur  en  ordonnée.  Les  deux  erreurs  peuvent 
aussi  ne  pas  être  indépendantes.  Nous  avons  étudié  ce  point 
en  détail  dans  la  seizième  leçon. 

Nous  avons  été  conduits  à  considérer,  dans  le  cas  du  point 
visé,  une  série  de  petites  ellipses  ;  la  probabilité  que  les 
coordonnées  du  point  soient  comprises  entre  x  et  x  -\-  dx, 
y  et  î/  -{-  dy^  s'est  exprimée  par  une  fonction. 

e^  dxdy^ 

et  le  polynôme  du  second  degré  P,  égalé  à  une  constante, 
nous  a  donné  l'équation  d'une  de  ces  ellipses. 

Revenons  aux  points  en  ligne  droite. 

Du  point  M,  comme  centre,  je  décris  une  ellipse  homothé- 
tique  à  l'ellipse  normale,  et  tangente  à  D.  Je  fais  la  somme 
des  carrés  des  grands  axes  des  ellipses  ainsi  décrites  autour 
des  divers  points  M,  et  j'écris  qu'elle  est  minimum. 

Ce  cas  se  ramène  aisément  au  précédent.  Par  une  trans- 
formation homographique,  ces  ellipses  peuvent  devenir  des 
cercles.  Si,  par  exemple,  le  petit  axe  est  la  moitié  du  grand 
axe,  on  multiplie  toutes  les  abscisses  par  2,  et  on  n'a  plus 
qu'à  chercher  le  moment  d'inertie  comme  tout  à  l'iieurc. 

6.  Probabilité  de  l'erreur  commise.  —  Le  problème 
se  divise  en  trois  : 

1°  On  peut  se  proposer  de  calculer  la  probabilité  a  priori. 

On  n'a  pas  encore  fait  les  observations  ;  on  sait  seulement 
qu'on  va  en  faire  n  et  qu'on  appliquera  la  méthode  des 
moindres  carrés.  Nous  connaissons  aussi  Ihabileté  de  l'ob- 
servateur. 

CALCUL    DES    PROBABILITÉS.  15 
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2°  Le  problème  est  entièrement  différent,  si  nous  ne  savons 
pas  à  l'avance  la  valeur  à  attribuer  à  la  constante  qui  entre 
dans  la  formule  de  Gauss.  Nous  ne  connaissons  pas  l'habi- 
leté de  l'observateur,  mais  nous  connaissons  les  résultats 
des  observations. 

3°  Nous  connaissons  l'habileté  de  l'observateur  et  les 
résultats  des  observations. 

7.  Premier  problème.  —  On  ne  connaît  pas  les  résultats, 
mais  on  connaît  l'habileté  de  l'observateur.  On  suppose 
alors  que  le  poids  est  le  même. 

Soient  î/^,  po-f-i  V"  ^^s  erreurs  qu'on  va  commettre. 
x^.,  a;^...,  x,,  seront  les  valeurs  approchées  des  quantités 
vraies  z^^  z.,^...,  z„. 

Celles-ci  seront  liées  par  q  =  n  —  p  équations  de  con- 
dition : 

*,■  (^-,1,   3-2,    ...   Z„)  =  O. 

Si  nous  substituons  à  ^^j ,  s'a,  ...  z^  les  quantités 
a;^ ,  a;^,  ...  x^,  ces  équations  ne  seront  pas  satisfaites  et  on 
aura  : 

*P,-  [X^,  X.2,  ...  x„)  =  [A,-, 

où  [X,  est  très  petit. 

Je  remplace  Xfe  par  y^.  -{-  z^^  et  je  développe  suivant  les 
puissances  croissantes  de  t//,.,  en  m'arrêtant  aux  termes  du 
premier  degré  : 

^\y\  +  •••  +  A„2/„  =  [X,-. 

Pour  tixer  les  idées,  faisons  n  =  3,  et  supposons  qu'il  y 
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ait  deux  équations  de  condition  : 

A,?/,  -f  A,,2/2  -|-  A3Î/3  =  i^, 
B,?/,  H-  B2?/2  +  B3.V3  =  a'. 

a,  [jl'  sont  très  petits,  mais  je  ne  connais  pas  leur  valeur, 
puisque  les  observations  ne  sont  pas  faites. 

Il  s'agit  de  calculer  les  corrections  yi  à  effectuer  sur  les 
valeurs  observées  Xi  ;  les  corrections  dépendent  évidemment 
de  [7.  et  de  ix',  et  nous  aurons,  par  exemple  : 

t/,  =  0  f[x,  xj!). 

Je  ne  connais  pas  la  forme  de  6,  mais  je  puis  développer 
suivant  les  puissances  croissantes  de  [x  et  de  y/,  et,  comme 
les  \i.  sont  très  petits,  négliger  les  carrés  des  \j.  ;  je  serai  con- 
duit à  poser  : 

y'\  =  ^if^  +  >^iV. 

y  3  =  ^3!^  +  ^3!-^'' 
en  général 

yî  =  '  iv-  -f  Vy-', 

les  X  étant  des  constantes  à  déterminer,  Gauss  les  déter- 
mine de  façon  que  la  valeur  probable  de  (y,-  —  y  [Y,  c'est- 
à-dire  de  : 

(2/t  —  >^/[^  —  Vp-')-, 
soit  minimum. 

Il  s  agit  de  la  valeur  'probable  en  supposant  que  Von  con- 
naisse d'avance  l'habileté  de  V observateur,  mais  non  les  résul- 
tats. Si  on  connaissait  les  deux,  la  solution  serait  en  général 
différente. 
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8.  Pour  bien  faire  comprendre  cette  différence,  je  vais 
examiner  le  cas  le  plus  simple  :  on  a  observé  plusieurs  fois 
la  même  quantité  z. 

On  prend  la  moyenne  des  observations,  ce  qui  est  con- 
forme à  la  méthode  des  moindres  carrés. 

L'erreur  commise  sur  la  moyenne  sera  : 

Vi  +^2  +  •••  ■\-y'K 

n 

La  probabilité  a  priori  de  l'erreur  commise,  pour  la  pre- 
mière observation,  par  exemple,  sera  (p  (t/ J  dy^. 

La  probabilité  a  priori  pour  que  z  soit  compris  entre  z  et 
z  A-  dz  sera  '|  [z]  dz. 

Cherchons  la  A'aleur  probable  de(^^    '    ^^  +  •••  "F  VrA  ^ 

quand  on  ne  connaît  pas  les  résultats  des  observations,   et 
qu'on  connaît  <]/. 


A=  /  ••  •  fï(iLLhii±ii^±y.'^ 


n 


ï(2/iJ?(^2)---?(y/J^i/i«^?/2---^2/A 


C'est  la  première  valeur  probable. 

Si  on   connaît  à  la  fois  l'habileté  de  l'observateur  et  les 
résultats,  on  a  une  deuxième  valeur  probable  très  différente. 


B: 


J\{yÙ9{y2)  ■■■  <!([yn)'\>{z)dz 


Dans  le  premier  cas,  on  avait  affaire  à  n  variables  indé- 
pendantes 3/,,  î/2,...  î/„,  d'où  une  intégrale  multiple  d'ordre  n; 
dans  le  second,  on  n'a  plus  qu'une  seule  variable  z. 
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Supposons  qu'au  lieu  (l'appli<iuer  la  rèt^'le  de  la  moyenne 
et  d'adopter,  par  conséquent,  poui-  z  la  valeur  : 

a;,  +  a;^  -f-  ■■■  -J- .r,,^ 
n 

on  ait  adopté  une  autre  valeur  : 

^^   ~r  ^'2      I      •••   ~T~  '^n 


Terreur  commise  eût  été  égale  à  : 

y t    +.y-2    +   •••    4-   lin 


-f^, 


4-^- 


Nous  aurions  trouvé  alors  pour  la  valeur  probable  du  carré 
de  cette  erreur  sans  connaître  les  résultats  : 

et  pour  la  valeur  probable  de  ce  même  carré  connaissant  les 
résultats  : 


lU  +  y2  +  •••+y/^ 


+  M    ?  (y < )  ?  (2/2 )  •  •  •  ?  {Vn )  •\  (^)  dz 


B: 


/?(2/<)  TO/2)  •••  ?(;'A)  '\{z)dz 


Alors  A  atteint  son  minimum  pour  e  =:  0,  pourvu,  que  la 
fonction  tp  soit  paire. 

Au  contraire,  pour  que  B  atteigne  son  minimum  pour  £==0, 
il  faut  que  la  loi  de  Gauss  soit  vraie-. 

Gauss  s'était  placé  au  premier  point  de  vue  dans  l'analyse 
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que  nous  avons  reproduite  dans  la  quatorzième  leçon,  et  il 
avait  ainsi  démontré  que  la  règle  de  la  moyenne  est  toujours 
légitime. 

Il  s'était  placé  au  second  point  de  vue  dans  l'analyse  que 
nous  avons  repi-oduite  dans  la  douzième  leçon,  et  il  avait  dé- 
montré que  cette  règle  n'est  légitime  que  si  la  loi  de  Gauss 
est  vraie. 
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1.  Revenons  au  problème  qui  nous  occupe  et  clicrchons  à 
déterminer  les  X.  Il  s'aarit  de  rendre  minimum 


[Vi  —  ^^)y-  —  ^l:^ 


a  et  ijl'  sont  des  fonctions  linéaires  des  y  ;  donc  c'est  vm 
polynôme  homogène  et  du  second  degré,  par  rapport 
ky^,  2/2' •••1  V"^  *1^^'^1  ^^^^  rendre  minimum. 

Par  hypothèse,  les  poids  sont  les  mêmes. 

Soit  'm?  la  valeur  probable  de  y]  ;  w^  sera  aussi  la  valeur 
probable  de  t/|,  et  celle  de  t/|. 

Si  nous  avions  à  faire  trois  observations,  nous  n'aurions 
pas  le  droit  de  supposer  à  Vavance  ^,  plus  grand  que  ?/,  o^ 
que  y^. 

La  valeur  probable  du  produit  y^y.-,  sera  nulle  :  elle  sera  le 
produit  de  la  valeur  probable  de  y^  par  la  valeur  probable  de 
^2,  et  la  valeur  probable  de  y^  est  nulle  puisqu'il  n'y  a  pas 
d'erreurs  systématiques.  Cela  est  vrai,  parce  qu'on  ne  connaît 
pas  les  résultats  observés,  et  ne  le  serait  plus  si  on  les  con- 
naissait. 

Comment  trouver  la  valeur  probable  du  polynôme?  On 
remplace  tous  les  termes  carrés  par  m-,  tous  les  doubles  pro- 
duits par  0. 


232  CALCUL    DBS    PROBABILITES 

Ce  polynôme,  si  on  substitue  à  [j.  et  u.'  leur  expression  en 
fonction  des  y,  devient  : 

le  coefficient  de  t/f  est  (X^A^  -|-  X{B^  —  l)^;  celui  de  y|  est 
/^Aa  -h  y^lB^Y;  celui  de  t/f  est  (XjAg  +  à;BJ^ 
Donc  : 


(2/i  —  ^ii^  —  '^îi^T 

=m2[(A^X,+B,X;-if-f-(A2X,+B,X;)2+(A,A,+B3X;)2]. 

Voilà  ce  qu'il  faut  rendre  minimum. 

2.  Appelons  m'^P  le  second  membre  :  il  représente  la 
valeur  probable  du  carré  de  l'erreur,  {y^  —  3/|)^,  qui  subsiste 
après  la  correction. 

Égalons  à  zéro  les  deux  dérivées. 


dl ,        dll  ' 


dP        dP 

c'est-à-dire  : 

A^(A^X,+B,X;-l)4-A,(A,X,+B2X;)+A3(A3X,+B3X;)=o, 

et  par  symétrie  : 

B,(A,X,+B,X;-l)+B2(A,X,+B2X;)+B3(A3X,+B3X,')r.o. 

Ce  système  peut  s'écrire  : 

X,SA2 -(-X;SAB  =  A^, 
X.SAB +  /;SB2  =  B,. 

Il  est  linéaire  par  rapport  à  X^  et  X^'. 
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J'y  ajoute  l'équation  qui  donne  3/,'  : 

À^(/.  -}-  X;a'  =  y[. 

En  éliminant  X,  et  X^'  : 

SAa       SAB      A^ 

SAB       2B2       B,         =  o. 

3.  Telle  est  la  correction  à  faire  pour  rendre  minimum  la 
valeur  probable  du  carré  de  l'erreur  après  la  correction. 
Elle  est  conforme  à  la  méthode  des  moindres  carrés. 
En  effet  y', ,  y!^^  y^  vérifient  : 

A,?/,'  +  A22/2  +  Agt/:;  =^a, 

Pour  calculer  les  y-,  il  faut  rendre   minimum  la    somme 
des  y  p. 


Donc  : 
D'autre  part 


^yîcly^  =0. 

^Aidy'i  =0, 
SB,-rfy;  =  o. 


La  première  de  ces  deux  équations  doit  être  une  consé- 
quence des  deux  autres;  donc  : 


d'où 


et  par  symétrie 


y;  =  sA, +  s'B„ 
£:::A*  -1-  e'SAB  =  u 

sSAB  +  s'SB*  —  u 
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En  éliminant  e  et  t  entre  ces  3  équations  : 

SA^       SAB 
SAB       SB^ 


Le  déterminant  est  le  même  que  le  précédent. 

Ainsi  le  résultat  est  le  même,  qu'on  applique  la  méthode 
des  moindres  carrés,  ou  bien  qu'on  fasse  la  correction  de 
façon  à  rendre  minimum  la  valeur  probable  du  carré  de  l'er- 
reur après  correction. 

4.  On  peut  se  demander  maintenant  quelle  est  cette  valeur 
minimum:  c'est  celle  de  m^P.  La  valeur  de  P  peut  être  mise 
sous  une  forme  plus  simple.  Rendons-le  homogène  : 

P=(A,X,  +B^X;-Aîj2  +  (A,X,,-f-B,X;)2-h(AA+B3X;)^ 

et  appliquons  le  théorème  des  fonctions  homogènes  : 

--^  -  d\^''^  dV,'  '^  d\",'- 

dP        dP 

Or  -r-  et  -77-7  sont  nuls  ;  X,'  =  1  ;  il  reste  : 
uA,        dk^ 


2P  =  ^ 

dX'i 


P  =  -^^=l 
2  dl'^ 


A/A, -B.X,', 


Le  produit  par  m^  est  la  valeur  probable  du  carré  de  l'er- 
reur qui  subsiste  après  la  correction. 

Quand  les  observations  deviennent  de  plus  en  plus  nom- 
breuses, la  valeur  probable  du  carré  de  l'erreur  va  en  dimi- 
nuant. 
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5.  Intruduisons  une  quatrième  quantité  et  une  troisième 
équation  de  condition: 

Tout  à  l'heure  nous  avions  à  rendre  minimum  : 


(1)  {y\  -^■ii-'-  -  ^)':^-'y'; 

maintenant  c'est  : 


(2)  (y,  _x,^-À;./-x';a'7. 

Il  y  a  une  indéterminée  de  plus,  À,';  le  minimum  de  l'ex- 
pression (2)  est  évidemment  plus  petit  que  celui  de  l'expres- 
sion (11  ;  car  il  suffit  de  faire  \'\  =  0  dans  l'expression  (2) 
pour  retomber  sur  l'expression  (1). 

6.  Allons  plus  loin.  Soit  y  l'erreur  réellement  commise. 

y  étant  la  correction,  y  —  y  est  l'erreur  qui  subsiste  après 
la  correction. 

Sy-  est  la  somme  des  carrés  des  erreurs  commises  ;  la 
valeur  probable  de  cette  somme  est  nr/î^. 

Cherchons  la  valeur  probable  de  la  somme  des  carrés  des 
corrections,  Sl7'"  ;    et  la  valeur  probable  de  la  somme  des 


carrés  des  erreurs  après  corrections,  SCy  —  y')-. 
7.  J'observe  que  nous  avons  : 

y'i  =  X,a-fXia'; 

y   est  une  fonction  linéaire   des  a,  qui  sont  des  fonctions 
linéaii'es  des  y.  Donc  y  est  une  fonction  linéaire  des  y. 

Ces  fonctions  y  ne  sont  pas  linéairement  indépendantes, 
car  elles  peuvent  s'exprimer  linéairement  en  fonction  de  deux 
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d'entre  elles,  dans  le  cas  présent,  et  en  général  en  fonction 
d'autant  d'entre  elles  qu'il  y  a  de  quantités  [^,  c'est-à-dire  de 
fi  —  p  d'entre  elles,  puisqu'il  y  a  autant  de  [x  que  d'équations 
de  condition. 

Considérons  les  y,  —  y  i  :  ce  sont  aussi  des  fonctions 
linéaires  des  y,  mais  pas  linéairement  indépendantes  ;  elles 
sont  liées  par  les  conditions  : 

Al  CVi  —yl)  +  A,  (^2  —  y^)  +  A3  (2/3  —  tj!^)  =  o, 
64  (?/,  —  ?/,')  +  B.,  [y.,  -  y!,)  -f  B3  {y.,  —  y^)  =  o. 

Il  y  a  ici  deux  relations  linéaires;  en  général,  il  y  en  a  p. 
Ainsi  les  y  s'expriment  en  fonction  linéaire  de  w  —  p  d'entre 
elles;  et  les  y  —  y'  en  fonction  linéaire  de  p  d'entre  elles. 

8.  Je  dis  que  l'on  a  identiquement 

,   En  effet  : 

y!  =  sA,-  -}-  e'B, 
^y^î/l  =  eSA^t/,  -f  e'SB,!/,-  =  vj.  -{-  £>' 
Sy/2  =  eSA,-3/;  +  eSB.y/  =  eiJ.  +  £>'. 

Autre  identité  : 

En  effet,  en  développant  S  (y  —  yy  : 

ce  qui  est  bien  une  identité,  puisque  en  vertu  de  la  précé- 
dente identité  : 

S?/'^  -  %^yy'  +  St/'2  =  o. 
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9.  Clierchons  la  valeur  probable  il^"-.  C'est  une  forme 
quadratique  par  rapport  aux  y. 

On  multiplie  rn-  par  la  somme  des  coefficients  des  termes 
carrés,  ou,  autrement,  on  considère  Yéquation  en  S. 

Soient  F  et  F'  deux  formes  quadratiques  par  rapport  à  /t 
variables  ;  si  S  est  une  constante, 

F  — SF' 

sera  encore  une  forme  quadratique  par  rapport  aux  n  va- 
riables. 

En  écrivant  que  le  discriminant  est  nul,  on  obtient  une 
équation  d'ordre  n  en  S,  dite  équation  en  S. 

La  propriété  de  cette  équation  est  de  ne  pas  changer  quand 
on  fait  un  changement  linéaire  de  variable  :  c'est  une  équa- 
tion invariante. 

Supposons  maintenant  que  nous  nous  proposions  de  cal- 
culer la  valeur  probable  d'une  forme  quadratique  F  ;  je  prends 
F=  S  y''.  Ecrivons  que  le  discriminant  de 

F  —  SSr/2 
est  nul. 

La  somme  des  racines  de  cette  é([uatiun  est  la  somme  des 
coefficients  des  carrés. 

Soit 

F  =  Ay?  +  AVI  -h  ^:'yl  +  'lï^y,y,  +  ^'y,y,  -f  ^2\Yy,y,. 

Le  discriminant  donne  : 

A  —  S 

B" 

B' 


B" 

B' 

A- 

-  S 

B  ' 

B 

A"- 

S 
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OU  : 

—  S3  -f  (A  -f  A'  -f  A")  S2  +  ...  =  o. 

La  somme  des  racines  est  bien  A  -f-  A'  -j-  A"  ;  d'autre  part, 
la  valeur  probable  de  yf  étant  m^  et  celle  de  y^y^  étant  0, 
celle  de  F  sera  : 

w?  (A  -I-  A'  H-  A"). 

Comme  règle,  on  forme  donc  F  —  S  S  y^,  on  prend  la 
somme  des  racines  de  l'équation  en  S  et  on  multiplie  par  m^. 

10.  Appliquons  ceci  à  la  forme  quadratique  S  y-. 
Soit  la  forme 

d»  =  S?/'2  —  SSy2^ 
ou  : 

cï,  ^  (1  _  S)  Sy'2  -  SS  (y  -  yy. 

Formons  l'équation  en  S  et  cherchons  la  somme  des 
racines. 

Les  quantités  y'  s'expriment  linéairement  en  fonction  de 
n  —  p  d'entre  elles  ;  Si/'^  se  décompose  donc  en  une  somme 
de  w  —  p  carrés,  et  l'on  a,  les  \  étant  des  fonctions  linéaires 
dest/, 

s/2^^f +  ?!  +  ...  + ç\_,. 

Les  y  —  y  s'expriment  en  fonction  de  p  d'entre  elles,  et 
l'on  a,  les  tj  étant  des  fonctions  linéaires  des  y^ 

S(t/-.yT  =  r,f +  7ii  +  ...  +  -nV 

Les  n  fonctions  linéaires  ainsi  obtenues  sont  linéairement 
indépendantes.  Si  elles  ne  l'étaient  pas,  remarquons  qu'on  a: 
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Le  premier  membre  est  une  somme  de  n  carrés  : 

y  \  1         Vit         •••1         y  n'i 

le  discriminant  de  la  forme  du  premier  membre  est  1.  Le 
second  membre  ne  peut  avoir  pour  discriminant  0.  On  a  ainsi  : 

$  =  (1  —  S)  2^2  —  SS-/i2. 

Le  discriminant  est  : 

(S— l)«-/'S''  =  o; 

n  —  p  racines  sont  égales  à  1 ,  et  p  égales  à  0,  la  somme  des 
racines  est  n  —  p. 

La  valeur  probable  de  "^y^  est  nm-  ;  d'après  la  règle  expo- 
sée plus  haut,  la  valeur  probable  de  Hy"^  sera: 

>]î/'2  =  [n  —  p)  ni^. 
Donc  : 


S  (t/  —  y')'^  =  pm^, 
par  différence. 

Ainsi  :  1"  la  valeur  probable  de  la  somme  des  carrés  des 
erreurs  commises  est  nm^;  2°  la  valeur  probable  de  la 
somme  des  carrés  des  corrections  faites  est  (n  —  p)m-  ;  3°  la 
valeur  probable  de  la  somme  des  carrés  des  erreurs  après 
corrections  est pw?^. 

11.  La  valeur  probable  de  l-y"^  est  plus  petite  que  la 
valeur  probable  de  S?/-. 

C'était  aisé  à  prévoir. 

Nous  cherchons  à  déterminer  les  corrections  de  façon  que 
la  somme  des  carrés  des  corrections. soit  minimum:  c'est  le 
principe  même  de  la  méthode  des  moindres  carrés. 
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A  mesure  que  les  observations  augmentent,  si  nous  consi- 
dérons l'erreur  commise  sur  une  observation,  nous  allons 
démontrer  qu'elle  tend  vers  zéro. 

Supposons  que  les  observations  augmentent  constamment  ; 
le  nombFe  p  demeure  constant,  ainsi  quepm^  ;  le  nombre  des 
termes  va  en  augmentant:  il  y  a  des  chances  pour  que  chaque 
terme  diminue  constamment. 


Si  nous  considérons  la  plus  petite  des  quantités  {y^  —  y'kf', 

10)71'' 

elle  sera  certainement  inférieure  à 

n 

Observons  une  même  quantité  n  fois  ;  une  seule  variable 
indépendante  :  p  =  l. 


S  (y  —  P  f  =  m-. 

Nous   avons    n  termes,   n   observations  faites    dans     les 
mêmes  conditions  ;  donc  : 


yy-y)-=-^- 

12.  Jusqu'à  présent,  nous  avons  supposé  que  la  précision 
était  connue,  mais  que  les  observations  n'étaient  pas  faites. 

Le  problème  se  pose  autrement;  on  ne  sait  rien  sur  la 
précision,  mais  les  observations  sont  faites. 

Nous  voulons  en  conclure  la  valeur  de  Ji  ou  celle  de  mr. 

Voici  la  solution. 

Les  y  ne  sont  pas  connues;  les?/'  le  sont  parla  méthode 
des  moindres  carrés,  sy^  est  connu. 

J'égale  sa  valeur  à  la  valeur  probable  calculée  a  priori': 

d'où  m'^. 
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13.  Cette  méthode  est  critiquée  par  M.  Bertrand. 

En  effet,  si  ou  lavait  appliquée  à  une  autre  combinaison, 
par  exemple  ^y'\  on  en  aurait  déduit  une  valeur  de  m  qui 
n  eût  pas  été  la  même.  La  méthode  peut  devenir  suspecte. 

C'est  un  problème  de  probabilité  des  causes,  et  nous  appli- 
querons les  règles  de  ce  calcul. 

Ou  demande  la  probabilité  a  posteriori,  pour  que  h  soit 
compris  entre  certaines  limites. 

Cette  probabilité  est 

CT,  est  la  probabilité  a  priori  de  la  cause,  c'est-à-dire  pour 
que  h  soit  compris  entre  fi  et  h  -\-  dh  ;  pi  est  la  probabilité 
pour  que,  si  la  cause  a  agi,  les  observations  aient  donné  des 
résultats  respectivement  compris  entre  x^  et  x^  -\-  dx^,  x^  et 

Cherchons  la  valeur  probable  d'une  fonction  de  h,f{h); 
cette  valeur  probable  est: 

Faisons  de  suite  la  remarque  que  le  résultat  va  dépendre 
de  la  probabilité  a  priori;  le  résultat  de  Gauss  ne  peut  donc 
déjà  être  tout  à  fait  exact. 

Si  je  détermine  h  par 


f[h)  =  r{h), 

cette  valeur  probable  de  h  dépendra  de  la  fonction. 

Si  je  cherche  la  valeur  la  plus  probable,  ce  sera  la  même 
chose. 

CALCUL   DES   PROBABILITÉS.  i6 


242  CALCUL    DES    PROBABILITES 

On  peut  se  tirer  d'affaire  à  une  condition  :  c'est  que  le 
nombre  n  soit  très  grand.  Le  facteur  cr,  n"a  plus  grande 
influence;  ainsi,  pour 

r[h)  =  ix^, 

toutes  les  méthodes  conduisent  au  même  résultat,  si  toute- 
fois le  nombre  des  observations  est  très  grand. 


VINGTIÈME  LECOX 


1.  Lorsqu'on  observe  une  quantité  z,  et  que  les  observa- 
tions ont  donné  x^,  x.,..-.-  x„,  on  peut  représenter cj, et p,  par 

HT,  =  'l  (/'i-s")  cUidz, 
p,  =  Il(h:^dx.,  ...  dx,^. 
où  : 


\^l 


-liZi/î 


La  probabilité  a  posteriori  pour  que  h  soit  compris  entre 
h  et  h  -}-  dh,  et  z  entre  ^  et  3-  -j-  dz,  est  : 

n<j;  (/^.gj  cJ^AcZ-g  dx^dx.J  ...  (/a;„ 
/  II'}  (/i,^)  d/idz  dx^dx.2  ...  ofa;,j 

Les  différentielles  dx^,  dx.^, ...  dx„  disparaissent  dans  ce 
rapport,  et  il  faut  intégrer  par  rapport  kh  de  0  à  -[-  2c  et 
par  rapport  à^de  —  x  à-f-oc. 

Imaginons  que,  au  lieu  d'une  quantité  z,  il  y  en  a  n,  2-^, 
-3-2,...  z,,.,  qui  sont  fonctions  de  p  variables  w,,  î<2,  •••  ?</»,  et 
que  les  valeurs  observées  des  z  sont  a; , ,  x.^^ ...  x„  ;  les  erreurs 
commises  sont  y,,  y. 2-,  •••  Vu- 

vsi  sera  la  probabilité  a  priori  de  la  cause  :  ici,  pour  que 
h  soit    compris   entre   h  et   h  -\-  dh^    et  pour  que    Uf    soit 
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compris  entre  ^(^  et  u^  ^  du^,  u.^  entre  Mj  et  u.2  -\-  du^  ..., 

cj,-  3=  t|/  (h,  t<|,  Mj,  •••,  «/>)  ^^^  du^du^  ...  c?Mp. 

Pi  sera  la  probabilité  de  l'effet  en  supposant  que  la  cause 
ait  agi. 

p,-  =  l\dx^dx.2  ...  o?^„, 


ou: 


n  ==  \/^-"-^-'. 


La  probabilité  a  posteriori  sera  : 

II'j/  (A.  M),  vt.j  ••■•>  ^h>^  ^^  dUi^du^  ...  du,,  dx^dx.^  ...  dx„ 
1  n^  (h,  u^,  u.^  ...,  Uj]  dh  di(^du.2  ...  dUf,  dx^dx.^ 


CtJO/i 


11  faut  intégrer  par  rapport  k  h  de  0  à  -j-  oo  ,  et  par  rap- 
port aux  u  de  —  oo  à  -|-  oo  ;  quant  aux  différentielles  des  x, 
elles  disparaissent  comme  précédemment. 

La  probabilité  cherchée  s'écrit  donc  : 

ïl<hdh  dUfdif^  ...  du,, 


Jll'\dh 


du^du.2  ...  du,, 


2.  Elle  dépend  de  la  fonction  (|/  qui  est  entièrement  arbi- 
traire, et  qui  est  soumise  à  l'idée  que  nous  nous  faisons  a 
priori  de  la  valeur  des  u  et  de  l'exactitude  que  nous  attribuons 
a  priori  aux  observations;  mais  <^  ne  joue  pas  le  plus  grand 
rôle  si  les  observations  sont  nombreuses. 

Je  vais  appliquer  à  cette  fonction  •}  une  forme  particulière, 
en  supposant  qu'elle  ne  dépend  que  de  h. 

On  justifie  cette  manière  de  voir  en  disant  que  les  mesures 
donneront  en   «énéral  aux  u  des  valeurs  très  voisines  les 
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unes   des   autres  ;    cju'elles    sont  comprises  dans   un    petit 
intervalle  où  la  valeur  de  z  variera   peu    si  les  observa- 
tions sont   concordantes. 
La  valeur  probable  de  h^  sera  : 

/  W'iflndh  du^du.^  ...  du,, 


/ 


Yl-ldh  du^du^  ...  du. 


Ces  deux  intégrales  doivent  être  calculées  de  la  même 
manière  :   h\  varie  de  0  à  -|-  ac  et  les  ?/  de  —  oo  à  -|-  x  . 

3.  Qu'est-ce  que  ^y"^  ?  C'est  une  fonction  de  .c,-  qui  est 
connu,  et  de  zi  qui  est  une  fonction  des  u. 

Par  la  méthode  des  moindres  carrés >  on  obtient  comme 
valeur  à  adopter  pour  iii  la  valeur  î(^  :  les  valeurs  des  u  ainsi 
définies  ne  sont  pas  exactes,  mais  elles  sont  les  plus  conve- 
vables  à  adopter. 

ui  =  M?  +  y,-, 
Vi  étant  très  petit. 

Les  yt  sont  des   fonctions  des  y,  et  on  peut  les  considérer 

comme  des  fonctions  linéaires  des  y,  en  négligeantles  carrés. 

Le  polynôme 

S?/2  =  P 

sera  du  second  degré  par  rapport  aux  y,  mais  non  homogène  ; 
il  atteint  son  minimum  quand  les  v  sont  nuls. 
Les  équations 

rfP 

-  -  =  o 

dVi 

doivent  être  satisfaites  quand  les  r  sont  nuls. 

Donc  P  ne  renferme  que  des  termes  du    second  degré  et 
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du  degré  zéro;  il  n'y  a  pas  de  termes  du  premier  degré. 

Pq  est  le  minimum  de  Sz/"",  ce  qu'on  a  appelé  Sj/'^,  dont 
la  valeur  probable  est  [n  —  p)  m'^.  Donc  P^  est  très  grand  en 
général,  et  il  y  a  d'autant  plus  de  chances  qu'il  soit  grand, 
qu'il  y  a  plus  d'observations. 

P„  =  (w  —  p)  A, 

A  étant  une  constante. 

Le  polynôme  Pj  est  obtenu  en  additionnant  entre  eux  les 
termes  du  second  degré  ;  il  y  a  un  très  grand  nombre  de 
carrés,  il  y  en  a  n,  et  les  coefficients  du  polynôme  P^  sont 
du  même  ordre  de  grandeur  que  n. 

P,  =  (n-p)Q, 

Q  étant  de  l'ordre  de  grandeur  de  A. 
La  valeur  probable  de  hy  sera  : 


Jiyj    — ' aZL__ __ . 

J^    f^\-2    g-/,(„-;,)(A+.Q)  dhdv.dv,^    ...   dVp 


on  intègre  par  rapport  à  A  de  0  à  -f-  ao  ,  et  par  rapport  aux 
w  de  —  00  à  -j-  00  . 

4.  La  première  intégrale  porte  sur 

Q—h[n  —  -p)  A 

qui  dépend  de  A;  et  sur 
qui  dépend  des  v. 
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11  faut  calculer  haut  et  bas 


CQ-U[><-V)QaV^dc.^...d0,,. 


Q  est  un  polynôme  homogène  et  du  second  degré  par  rap- 
port aux  V  ;  je  pose  : 

co,-  =  y,-  \Jh. 

/iQ    devient  un    polynôme  Q'  homogène   et    du    second 
degré  par  rapport  aux  w. 
L'intégrale  devient  : 


_2 


Çe-'<"—v'>'^'diMydi,i^...dLOpli    2 


Les  limites  de  l'intégrale  restent  les  mêmes,  et  la    valeur 


de  l'intégrale  est  : 


où  B  ne  dépend  pas  de  h. 
Alors  : 


gr  n     n  —  p 

_  f        dh\h^iz'  -h     2    e-AA{n-p)B 

h  =  -^ 

•^  0 


ou  : 

-00 


-J  0 
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Je  pose  : 


/?v  := 


0 


XI 

Pdh 


^  0 


formule  qui  dépend  de  ^. 

5.  Si  nous  voulions  pousser  plus  loin,  il  faudrait  intro- 
duire une  hypothèse  sur  <\>.  Cependant,  quand  on  suppose 
n  — p  très  ^rand,  la  fonction  'j/  n'a  plus  d'influence. 

Lorsqu'on  a  : 

CF'l>"dh 


/f.*„ 


dh 


et  qu'on  fait  croître  n  indéfiniment,  la  limite  de  ce  rapport 
est  : 

où  h.Q  est  la  valeur  qui  rend  <I»  maximum. 
On  a  donc  ici  : 

7?v  z=   - 


c'est-à-dire  : 

1^  r=  Jil, 

/?Q  étant  la  valeur  qui  rend  <ï>  maximum. 

A  cette  condition  de  n  très  grand,  la  valeur  probable  de 
h''  ne  dépend  plus  de  i]/  ;  la  valeur  probable  de  h  est  toujours 
7?y,  quel  que  soit  v. 
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Il  n'en  serait  pas  de  même  si  l'on  ne  supposait  pas  n  très 
o"rand. 

De  plus,  y%  doit  être  très  grand,  non  seulement  en  valeur 
absolue,  mais  par  rapport  à  p  d'une  part  et  à  v  d'autre 
part. 

Ainsi,  si 

n  —  » 

il  faudrait  rendre  maximum  non  plus  <I>,  mais  iI>A-. 

6.  Si  n  n'était  pas  très  grand,  on  aurait  à  rendre  maxi- 
mum: 

d'où  : 

si  n  est  grand,  la  valeur  de  h  est  à  très  peu  près  celle  qui 
rend  maximum  $  [h). 

,     J n — p 

"  ~~  2A  ~  2S2/'2' 

car  : 

Sy  2  =  {n  —  p)  A  ; 

ce  résultat  est  conforme  à  la  loi  de  Gauss  : 

Ilî/'2  -—   ^^^  p)47l-. 

La  valeur  probable  du  carré  de  l'erreur  est  : 


_1_ 
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d'où  : 


et  par  suite 


n  —  p 
^ij-  — -^ 


h    ^"-^^ 


c'est  bien  la  même  valeur. 

Il  ne  faudrait  pas  attacher  g-rande  importance  à  ce  qu'on 
a  raisonné  sur  n  —  p  au  lieu  de  n,  parce  que  n  est  très  grand 

et  que est  voisin  de  1. 

La  règle  est  donc  justifiée  si  le  nond)re  des  observations 
est  très  grand. 
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1.  Je  vais  appliquer  la  méthode  des  moindres  carrés  à 
une  question  nouvelle,  la  recherche  d'une  fonction 
inconnue  /"  {x). 

Nous  mesurons  certaines  valeurs  de  cette  fonction. 

r(a„)  =  A„. 
Construisons  la  courbe  : 

y  =  f[x)^ 

dont  on  a  ainsi  un  certain  nombre  de  points. 

On  pourrait  toujours,  par  ces  points  M,,  Ma,.--  M„,  faire 
passer  une  courbe,  mais  cette  solution  ne  serait  pas  la  meil- 
leure: on  fait  passer  une  courbe  près  de  ces  points,  aussi 
continue  que  possible. 

Un  autre  procédé  présente  aussi  un  certain  degré  d'arbi- 
traire comme  le  procédé  géométrique  :  je  veux  que  ma 
courbe  soit  de  degré  q  aussi  petit  que  possible. 

/•(a;)  =  Co  +  C^a;+...  +  C,x<?. 
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q  est  plus  petit  que  n  —  1  ;  car  si  q  était  égal  à  n  —  1,  on 
aurait  une  fonction  satisfaisant  exactement  aux  conditions. 
Quelle  valeur  attribuer  à  5-  ?  Cette  valeur  est  arbitraire. 
On  la  choisit  d'abord  assez  petite,  puis,  si  elle  est  insuffi- 
sante, on  introduit  un  terme  de  plus  dans  le  second  membre, 
et  ainsi  de  suite. 

2.  Laissons  de  côté  ce  mode  de  tâtonnements  et  supposons 
q  choisi. 

Nous  déterminerons  les  coefficients  du  polynôme  de  telle 
façon  que 

S[/-(a,)-A,]2 

soit  minimum. 

f[x)  est  linéaire  par  rapport  aux  coefficients  C. 
Je  vais  poser: 

F(^)  =  (^  —  a^)  [x  —  a.y)  ...  [oc  —  a„). 

La  question  se  rattache  au  développement  en  fraction  con- 
tinue du  rapport 

Y{x) 

Ce  développement  s'opère  comme  si  l'on  cherchait  le  plus 
grand  commun  diviseur  de  F  et  de  F'.  On  aura  successive- 
ment : 

F  =Q^F'  +  R^, 

F  =  Q^R,  +  R„ 

1*«    3  ^^  Q«  -  ^  ^^'î  -  2  ~r  ^^«  - 1  ' 
R„_,  =  Q„R„_,. 
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11  n'y  a  pas  de  terme  R„  dans  la  dernière  équation,  car 
R„  =-  o. 

En  général,  F  est  de  degré  n,  F'  de  degré  n  —  1,  R|  de 
degré  n  —  t,  R,,  de  degré  n  —  p  —  1,  R„_ ,  de  degré  0  et 
tous  les  Q  de  degré  \ . 

On  a: 


F' 

1 

F 

Q. 

1 

F' 

R, 

1 

'  Q=+l: 


R„-,  \ 


R„_3~..  .   H 


Ainsi 


F' 


F-Q,  +1 


Q2  +  i 


Q3  +  •- 


^^"-+5:, 


3.  Nous  avons  à  considérer  les  réduites  successives  de  ce 
développement.  Comme 

F-Q,F=R,, 
à  la  place  de  : 

F-0,R,  =R^, 


254  CALCUL    DES    PROBABILITES 

je  puis  écrire  : 

-Q,F+F'(1  +  Q,Q,)  =  R,. 

Si  je  pose  : 

N,  =  1,  D,  =  Q,, 

j'aurai  : 

N^F-D,F'  =  R^. 
Si  je  pose  : 

Na  =  -Q2  D,  =  -  (1  +  Q,Qo) 

j'aurai  : 

N^F— D-.F'  =  R.,. 

Nous  exprimerons  de  la  même  manière  un  quelconque  des 
restes  successifs. 

N,F  -  D,F'  =  R„ 
N,^^F-  D,^,F  =R,,,. 
Comme  : 

R,^,  =  (N,F  -  D,F  )  -  Q,^,  (N,,  ^F  -  D,^  ,F'). 
Si  je  pose  : 

^^  i  +  2   ^^  N  /  Q/  +  2  ^^  /  +  1  ' 

^(  +  2    ^^  ^i  Q(+  2^(+  I  î 

j'aurai  encore  : 

R.  +  2  =  N,  +  ,F-D,^,F'. 
Sur  ces  relations  de  récurrence,  on  constate  que  : 
R,,  Ra,  ...etR„_2 
sont  respectivement  de  degré  n  —  2,     n — 3,     ...  et  1,  et 
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que  R„_ ,  est  une  constante.  N,  est  de  degré  0,  Na  de  degré 
1,  ...,  N,  de  degré  i  —  1.  On  voit  aisément  que  si  cette  pro- 
position est  vraie  pour  N,et  N,^  , ,  elle  Test  encore  pour  N,-+  3. 
D/  est  de  degré  i. 

4.  Je  dis  maintenant  queN,  et  D,  sont  le  numérateur  et  le 
dénominateur  de  la  réduite  d'ordre  i. 

Les  relations  de  récurrence  le  rendent  évident  ;   mais  on 
peut  le  voir  autrement. 

J'écris  la  suite 

F  =  Q,F+R„ 


R,_2  =  Q,R,_,  +R„ 


d"où  je  déduis  : 

F'  1 


F-Q,  +  l 


Q. +  .. 


1 


Q,  +  —  ' 


R.-i 

Je  puis  encore  écrire  l'équation  suivante  : 

N,F  -  D,  F  =  R,. 
Supposons  que  l'on  veuille  calculer  la  réduite 
a,_    _1 

h    Q,  -f  1 

Q2  + 
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Je  n'ai  qu'à  faire  R,  =  0  dans  l'égalité  précédente,  et  faire 
aussi 

F  =  p„      .       F'  =  a,. 

a,  =  QoR;  +r^ 

les  R  étant  devenus  des  R'. 

On  a  entre  lesR'  également  des  relations  de  récurrence. 

h;  =  QaH^  -H  H^ 

R/_2  =  Q,R/-,, 

R,-  est  nul  ;  donc,  N^  et  D,  étant  les  mêmes  que  plus  haut, 

N,:P,  -  D,a,  =  0, 

h  ~  D, 

N-         . 

~  est  bien  la  i"  réduite, 

^/ 

Quelle  relation  y  a-t-il  entre  cette  réduite  et  le  problème 
proposé? 

5.  L'équation  fondamentale  est 

N,F  -  D,F  =  R,. 

Faisons  attention  au  degré  de  tous  ces  polynômes.  Rappe- 
lons que  :  N,  est  de  degré  i  —  1  ;  F  est  de  degré  n  ;  D,  est  de 
degré  i  ;  F'  est  de  degré  n  —  1  ;  R/  est  de  degré  n  —  1  —  i. 

De  l'équation  fondamentale  je  tire  : 

F  '       F 
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Je  multiplie  les  deux  membres  par  x^.*. 

F      —  i.\ixv         p 

Je  m'en  vais  évaluer  la  somme  des  résidus  dans  les  deux 
membres  ;  notons  d'abord  que  pour  ce  calcul  nous  ne  devons 
tenir  compte  que  des  deux  fractions  où  F  entre  au  dénomi- 
nateur. 

Supposons  ensuite  que,  dans  une  fraction  rationnelle,  le 
degré  du  numérateur  soit  d'une  unité  inférieur  à  celui  du 
dénominateur,  par  exemple 

A''x"-*  +  BV-2  +  ...^ 


A'œ"  -f-B'a;"-'  -f  ...     ' 
cette  fraction  se  décomposera  en  : 

X  —  a  [x  —  a)'' 

Si  je  multiplie  par  x, 

X  —  a 

tendra  vers  SA,  ou  la  somme  des  résidus,    quand  x   croîtra 
indéfiniment,  les  autres  S  (c'est-à-dire  celles  où  i»  —  a  entre 
au  dénominateur  aune  puissance  plus  grande  que  1)  s'annu- 
leront. 
Mais  : 

,.      xP 

lim  -=-  =  o,     pour  X  =  ce  , 

si  le  deg-ré  de  ^P  est  plus   petit  que  -  celui  de  Q.  Donc  : 
la  somme  des   résidus   sera    nulle  si  le  degré  du  numéra- 
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teur  est  inférieur  de  plus  d'une  unité  à  celui   du  dénomina- 
teur. 

Considérons 

F    ' 

le  dénominateur  est  de  degré  n,  le  numérateur  de   degré 
n  —  i  —  ^  -j-  [A.  Si  : 

n  —  1  —  i  -}-  p.  <  n  —  1, 

c'est-à-dire  : 

ij.  <  ï, 

la  somme  des  résidus  sera  nulle. 

Ainsi  quand  ix  est  égal  à  0, 1 , . . . ,  ^  —  1 ,  la  somme  des  résidus 
sera  nulle. 

P 

6.  Quand  on  a  affaire  à  la  fraction  rationnelle  pr;  et  que 

Q  n'a  pas  de  racines  multiples  et  s'annule  pour  x  ^  a,  le 

résidu  pour  x  ^:^  a  est  ,-,,  ;  \' 

^  Q  (a) 

Prenons  pour  a  l'une  des  valeurs  qui  nous  a  servi   à  cal- 
culer/"  (a;)  ;  le  résidu  par  rapport  à  a  de 

F 

sera  : 

gH-D,-  (g)  F^  ia) 
F'  (a)        ' 

ou  : 

rt!^-D,-  (a). 
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Ainsi,  pourvu  que  u.  soit  plus  petit  que  i  : 

Saf^D,  (a)  =  o, 

la  sommation  étant  étendue  à  toutes  les  valeurs  de  a  : 

Clf^  Cl.2,  ...,  tt^' 

Il  en  résulte  que  si  P,_(  est  un  polynôme  quelconque 
d'ordre  i  —  1  : 

SP,_,  (a)D,(a)  =  o. 

Prenons  : 

P,-,  =D,.; 

alors  : 

SD/,  {a)  D,-  (a)  --=  o. 

Cette  équation  est  vraie  pourvu  que  k  soit  plus  petit  que  i. 

Mais,  comme  rien  ne  distingue  les  deux  indices,  cette 
équation  est  encore  vraie  toutes  les  fois  que  k  est  différent 
de  i. 

Les  polynômes  de  Legendre  ont  une  propriété  analogue  ; 
pour  deux  d'entre  eux 


on  a 


/  ^mynd-  =  0  ; 


ici,  au  lieu  d'intégrales,  on  considère  des  sommes  finies, 

7.  Nous  voulons  obtenir  un  polynôme  d'ordre  q  plus  petit 
que  il  —  1,  dont  les  coefficients  seront  choisis  de  telle  sorte 
que 

soit  minimum. 


260  CALCUL    DES    PROBABILITES 

Si /"(a?)  est  un  polynôme   d'ordre  ^,  il   peut  toujours  être 
mis  sous  la  forme 

f[x)  =  C,  +  C^D,  {œ)  4-  C,D,  {x)  -f-  ...  +  C,D,  (x). 

Il  s'agit  de  déterminer  les  coefficients  C  de  façon  à  rendre 
minimum  la  somme  des  carrés 

S  (A  -  Co  -  C^D,  -  C,T),  -  ...  -  C,D,)2. 

8.  Développons  ce  carré. 

Sur  une  première  ligne,  nous  mettrons  les  termes  carrés  : 

SA2  +  nCl  +  CfSDf  +  C|SDi  +  ...  +  qsD^ 

Sur  une  seconde  ligne  nous  mettrons  la  somme  des  termes 
rectangles  tels  que 

—  2CoSA  —  2C^SAD,  —  ...  —  2CçSADç, 

où  : 

SAD,  =  A^D^  (a^)  +  ...  +  A,D,  (a„). 

;  Sur  une   troisième  ligne   nous   mettrons   une  somme  de 
termes  tels  que  : 

•    2CoQSD,  +  2CASD,D^. 
Or: 

SD,  {a)  =  o 

SD,D,.  =  o. 

Restent  la  première  et  la  deuxième  lignes.  Je  puis  d'ailleurs 
abréger  l'écriture  en  posant  : 

La  somme  des  termes  à  rendre  minimum  se  réduit  à  : 
SA-  +  ^CfllDf  —  2SC,SAD,. 


VINr.T    ET    UNIÈME    LEÇON  261 

Je  diflérentie  par  rapport  à  C,  et  je  divise  par  2  ;   en  éga- 
lant à  zéro  la  dérivée  par  rapport  à  C,  : 

C,SD?  =  SAD„ 

d'où  l'expression  suivante  pour  C,  : 

SAP, 

\^j  — 

c'est-à-dire 


r.  — 


C  ^  4A-  [ad  4-  A^D/  [a^)  +  •••  +  A«D,  {a„) 
D?  (a,    +D,M«o)+  ...+DM««) 

L'analogie  avec  un  autre  problème  d'analyse  est  évidente. 
Quand  on  veut  développer  une  fonction  f{x)  en  série  pro- 
cédant suivant  les  polynômes  de  Legendre,  on  arrive  à 


ou  : 


C, 


/•(a.)  =  vC,X,, 


L 


Ici  les  relations  sont  du  même  genre,  sauf  que,  au  lieu 
d'intégrales,  figurent  des  sommes. 

9.  Quel  est  l'avantage  de  ces  polynômes  D  ? 

Je  suppose  que  l'on  ait  essayé  d'abord  de  représenter  les 
observations  par  un  polynôme  de  degré  ^  :  on  a  trouvé  alors 
Cq,  c,,...,  Cç.  On  constate  ensuite  que  la  somme  des  carrés 
des  erreurs  commises  est  inadmissible  :  on  se  résigne  alors 
à  poursuivre  avec  un  polynôme  de  degré  q  -\-  i.  Tout  serait 
à  recommencer,  si  l'on  avait  eu  recours  à  un  procédé  quel- 


262  CALCUL    DBS    PROBABILITES 

conque  ;  ici,  au  contraire,  on  n'a  qu'à  ajouter  un  terme 
Cç+^Dç+^  {x)  :  les  précédents  coefficients  Cq,  C^...,  C^,  ne 
changent  pas  comme  on  le  voit  sur  l'expression  de  Cj. 

10.  Le  problème  se  pose  déjà  quand  on  veut  simplement 
interpoler  une  fonction  :  pourquoi  prend-on  habituellement 
comme  solution  un  polynôme  d'ordre  n  —  1  ? 

Voici  une  fonction  /  (a?),  holomorphe  à  l'intérieur  d'un 
certain  contour,  d'un  cercle  par  exemple.  Les  valeurs  que 
nous  avons  données  à  la  variable  sont  petites  par  rapport 
au  rayon  du  cercle. 

Pour  les  valeurs  a^,  a^..-,  an  de  la  variable,  on  connaît  la 
valeur  de  la  fonction.  11  s'agit  de  connaître  la  valeur  de  la 
fonction  pour  une  valeur  x  à  l'intérieur  du  cercle. 

L'intégrale 


/,■ 


r[z)dz) 


[z  —  x)  [z  —  aj  [z  —  «2)  •••  [^  — 
s'annule  prise  le  long  du  cercle.  D'autre  part 
1     Ç f  (z)  dz 


2j7:  /  {z  -  x)  (z  —  a^)  (z  —  a^) 


est  la  somme  des  résidus  de  la  fonction  /  {z)  pour  les  pôles 
X,  a,,  a^f..,  a„,  c'est-à-dire  : 

tM _L    fl<ï I... 

{x~a^){x — a^)...{x—a„)    '    (a^ — x){a^ — a.^}...{af — a„) 

J'appelle  en  général  P^  le  polynôme  que  l'on  obtient  en 
supprimant  dans  : 

(z  —  x)  [z  —  a^)  {z  —  a.2)  ...  [z  -—  a„) 
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le  facteur  z  —  a,,  et  en  remplaçant  z  par  «,. 

-  F  {X)  +    P,     +    P,  ■+•••+    P„    ' 


d'où 


m=-^riaii-^^  +  ivi.). 


11.  Telle  est  la  formule  générale  de  l'interpolation;  au 
second  membre  figurent  :  1°  un  polynôme  entier  ;  2^  l'erreur 
commise  qui  est  JF. 

Cette  erreur  est 


f[z)  dz  X  —  g,  X  —  a.,       x  —  a^ 
X  z  —  a,  z  —  rt,       z  —  a,, 


Si  R  désigne  le  rayon  de  convergence,  et  que  x  soit  assez 
voisin  de  «;  pour  que  : 

X  —  «,     <  -^1 


chacun  des  facteurs sera  plus  petit  que  -»  et  sous  le 


signe  /  il  y  a  n  de  ces  facteurs. 


Donc  JF  sera  très  petit  si  n  est  très  grand. 

S'il  était  seulement  probable  que  le  rayon  de  convergence 
ait  une  certaine  valeur,  on  serait  en  présence  d'une  question 
de  probabilité. 
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1 .  Je  suppose  que  l'on  sache  a  2-)riori  que  la  fonction  f  [x) 
est  développable,  dans  un  certain  domaine,  suivant  les  puis- 
sances croissantes  de  x. 

f{x)  =  A^^A^x-{-  ... 

Nous  ne  savons  rien  sur  les  A,  sauf  que  la  probabilité  pour 
l'un  d'eux,  A;,  d'être  compris  entre  certaines  limites,  y  et 
y  H-  o?y,  est  : 

'h, 


\/\ 


e  'Hv'^di/. 


Nous  connaissons  par  n  observations 

rM  =  B^, 

Nous  cherchons  la  valeur  probable  de  f{x)  pour  une  autre 
valeur  de  x. 

C'est  un  calcul  d'interpolation,  avec  cette  différence  que 
nous  cherchons  un  polynôme  limite. 

Je  me  hâte  d'ajouter  que  je  considère  la  question  comme 
un  simple  exercice  de  calcul,  car  j'ai  introduit  arbitrairement 
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la  loi  de  Gauss  ;    autrement  le  problème  resterait  indéter- 
miné. 

2.  Nous  avons  à  déterminer  les  coefficients  A,  en  nombre 
infini  de  la  fonction,  à  l'aide  de  n  observations  :  ici,  il  y  a 
plus  d'inconnues  que  d'observations,  et  nous  ne  pouvons 
nous  guider  que  par  l'idée  que  nous  nous  faisons  a  priori  de 
la  loi  de  probabilité. 

Nous  nous  élevons  ainsi  en  généralité  plus  encore  que 
nous  ne  l'avons  jamais  fait  jusqu'ici,  puisque  nous  avons  à 
déterminer  une  l'onction  inconnue. 

Je  vais  d'abord  ne  prendre  qu'un  nombre  fini  de  coeffi- 
cients. 

3.  D'une  manière  générale,  soit  un  nombre  fini  d'incon- 
nues, 

Mj  ,  ^21  •••1  '^p  ) 

p  est  connu. 

Je  suppose  que  la  probabilité  pour  que  w,-  soit  compris 
entre  u  et  u  -|-  du  est  représentée  par  la  loi  de  Gauss, 

y/h  e-'^i-'du- 

La  probabilité  pour  que  l'un  des  u  s'écarte  de  zéro  sera 
d'autant  plus  petite  que  h  sera  plus  grand. 

Nous  connaissons  les  valeurs  de  certaines  fonctions  des  ?«, 

en  supposant  les  observations  parfaitement  exactes. 

n  est  plus  petit  que  p,  il  y  a  plus  d'inconnues  que  d'ob- 
servations. 

Je  suppose  que  les  x  sont  fonctions  linéaires  des  u  ;  c'est 
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ainsi  que,  dans  l'exemple  qui  précède,  les  B  étaient  fonctions 
linéaires  des  A  et  que  l'on  avait  : 

Ba=  Ao  -\-A^a,,  +  ... 

Je  pose  donc  : 

Les  observations  nous  ont  appris  que  y^  est  compris  entre 
X/^  et  iJC/c  -\~  dx/,.  Chercher  les  u,  c'est  résoudre  un  problème 
de  probabilité  de  causes.  Les  causes,  c'est  que  les  u  sont 
compris  entre  certaines  limites  ;  les  effets  observés,  c'est  que 
les  oc  sont  compris  entre  certaines  limites. 

La  formule 

va  se  simplifier  ici. 

4.  Si  les  ?f  ont  des  valeurs  déterminées,  les  fonctions 
linéaires  Xi^  auront  également  des  valeurs  déterminées,  et  la 
probabilité  de  ces  valeurs  sera  la  certitude  ;  suivant  que  ces 
fonctions  tomberont  ou  non  entre  les  limites  données  par 
l'observation,  la  probabilité  sera  1  ou  0.  Donc  la  formule  de 
la  probabilité  a  posteriori  se  simplifie  en 

si  l'on  a  représenté  par  p,-  la  probabilité  de  l'effet  quand  la 
cause  agit. 

StJ/  porte  sur  toutes  les  probabilités  relatives  aux  valeurs 
des  u  compatibles  avec  les  observations  ;  vsi  est  la  probabi- 
lité a  priori  pour  que  les  diverses  quantités  u  soient  com- 
prises entre  certaines  limites. 
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La  k"  inconnue  a  pour  probabilité  d'être  comprise  entre 
u;,  et  ui,  -f-  duk 

zsi  comporte  p  facteurs  analogues  : 


j'écrirai  pour  abréger  : 

CI,  =  Illlu^du.2  ...  dUp 
d'où  : 

Scj/  =  /  Ildu^du.^  ...  diip. 

Il  faut  intégrer  pour  toutes  les  valeurs  des  ii  compatibles 
avec  les  observations,  c'est-à-dire  satisfaisant  aux  inégalités 

Xk  <  Cl.M^  -f  C^W2  -1-  ...  -j-  Clu,,  <  X,,  -f  rfa;/,. 

La  probabilité  cherchée  sera  : 

rô,  Iidu^du.2  ...  f/«/. 


SCT/ 


/  Yidu^du.2  ...  f^Wp 


quand    les    u   satisferont    aux   inégalités   ci-dessus.   Sinon 
l'on  aura  0  comme  probabilité. 

5.  Si  je  cherche  la  valeur  probable  d'une  fonction  quel- 
conque F  des  M  : 

/  ¥'^.du^du.^  ...  dup 


/  lidundu^  ...  dUf^ 
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Nous  allons  transformer  ces  deux  intégrales. 
Ona: 

cck  <  Vk  <  X,,  -\-  dxk. 

Je  vais  prendre  pour  inconnues  ?/^,  y^  ....,  _y„,et  j'y  adjoin- 
drai p  —  n  fonctions  linéaires  des  u  tout  à  fait  quelconques, 

Iidu^du.2  ...  dup 

va  se  transformer  en  : 

U^dy^dy^  ...  dy„dz,dz2  ...  dz,,_n. 

A  est  le  déterminant  fonctionnel  des  u  par  rapport  aux  y 
et  aux^;  comme  ce  sont  des  fonctions  linéaires,  A  est  cons- 
tant. Il  vient . 

_  FUdy^dy^  ...  dy^dz^dz.^  ...  dzp_n 


Judy^dy^  ...  dy^dz^dz^  ...  dz^,_„ 

Nous  avons  à  intégrer  d'abord  par  rapport  aux  y  :  y^  par 
exemple  variera  depuis  x^  jusqu'à  Xf    -\-  dx^^   c'est-à-dire 

très  peu  ;  la  fonction  sous  le  signe  /  va  rester  sensiblement 

constante,  et  l'on  pourra  écrire  : 


_       dxi^dx.-,  ...  dx ,A  YYidz ,^dz . 
F  ^  -^ 


dZr. 


dx^dx^  ...  dx,^,  j  Udz^dz2  ...  dz 


p  —  n 


Les  différentielles  des  x  disparaîtront. 
Fn  et  n  sont  des  fonctions  des  z,  et  nous  intégrerons  par 
rapport  aux  z  àe  —  oo   à  -]-  oc  . 
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H  est  le  produit  d'un  facteur  constant  par  une  exponen- 
tielle, e— (''i"i-  +  /'2"/-+- -l-V/'-);  l'exposant  est  un  polynôme 
du  second  ordre  et  non  homogène  par  rapport  aux  z,  F. 

6.  Supposons  F  fonction  linéaire  des  z.  Cherchons  la 
valeur  probable  de  F. 

Les  valeurs  probables  des  différentes  quantités  z  s'ob- 
tiennent en  cherchant  les  valeurs  qui  rendent  minimum 
l'exposant  P  :  soit  ^^-  la  valeur  de  Zi  qui  rend  P  minimum. 

Alors  : 

P  =  P,  .-f-  Po. 

Pq  est  une  constante,  et  P^  est  un  polynôme  homogène  et  du 
second  degré  par  rapport  aux  quantités  Zi  —  zf. 
L'intégrale 

/  {Zi  —  zf)  e-^dz ^dz.2  ...  dzp^„ 

porte  sur  une  fonction  impaire  par  rapport  à  Zj  —  zf  ;  en 
intégrant  de  —  x  à  -f-  x  ,  on  aura  zéro  pour  la  valeur  de 
cette  intégrale. 

On  en  déduit  que,  si  F  est  égale  à  F^  quand  on  y  remplace 

Zi  par  zf, 

j   F  —  Fq)  e-^dZfdz.2  ...  dzj,_„ 

est  nulle,  prise  de  —  x  à  -[-  x  . 
De  même  : 

I    F  —  Fqi  Udz^dz.,  ...  dz^,_,^  =  c»; 
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et  par  suite  : 

/  FUdZfdz^  ...  dzp^n  =  Fq  /  ^dz^dz2  ...  dzp_n, 

c'est-à-dire  : 

F-Fo. 

Ainsi  on  obtiendra  la  valeur  probable  de  F  en  substituant 
à  Zf  les  valeurs  qui  rendent  minimum  le  polynôme  P. 

7.  Appliquons  ces  principes  au  problème  que  j'ai  posé  au 
début  de  cette  leçon. 
Au  sujet  de  f  (x),  nos  inconnues  u  sont  les  A  et  nous  avons  : 

P  =  7.oAi+A,A|-f-...+A,AF-}-... 

Il  faut  rendre  ce  polynôme  minimum. 
Les  valeurs  des  A  seront  d'ailleurs  arbitraires,   sauf  les 
relations  linéaires  données  par  les  observations  : 

r{a,)=  B,. 

Écrivons  que  P  est  minimum.  L'accroissement  c^P  devra 
être  nul  quand  les  A,-  s'accroîtront  de  dA.i  : 

dP  =  AqAoC^A,,  +  ...  -f  7?,A,(iA,-  +  ...  —  o. 

Les  accroissements  rfA^,  ...,  c^A,,  ...  sont  liés  par  : 

df  [ttk)  =  o. 

Or,  f{a^)  par  exemple  est  égal  à  : 

/■(«O  =  Ao  -f  k,a^  -}-  ...  +  kia\  +  ... 
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Donc  : 

o?A(,  -{-  a^dA^  -\-  ...  -\-  a\dAi  -|-  ...  =  o, 
cIAq  +  a.2d\^  -{-...-{-  ai^dXi  -\-  ...  =  o, 

dk^  +  a„dki  +  ...  +  rt'„f/A,  -f  ...  =  o. 

8.  Pour  que  P  soit  minimum,  la  prejnière  équation  : 

rfP  =  o 

doit  être  satisfaite  quels  que  soient  les  dK  ;  cette  première 
équation  doit  être  une  conséquence  des  n  autres  relations 
entre  ces  dk. 

Soient  e^,  £01  •••  ^"  ^^^  coefficients  convenablement  choisis, 
par  lesquels  nous  multiplions  respectivement  les  deux 
membres  de  chacune  de  ces  n  relations. 

hiki  =  t^a\  -\-  z.,a%  -j-  ...  -f-  t„a;, 
Si  je  pose  : 

f^=i  +  f;  +  i  +  -+f+-- 

le  coefficient  de  z^  dans 

sera  9  (a7fl^),  etc. 

11  vient  donc  finalement  : 

f{x)  =  £^2>  (aJfl.)  +   £2?  (^^2)   +    •••   +    £«?  («^««)- 
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Nous  disposerons  des  coefficients  e  de  façon  à  satisfaire 
aux  observations,  d'où  n  équations  à  n  inconnues. 

9.  La  forme  de  f  [x)  dépend  des  h.  Pour  que  la  série  qui 
représente  cp  yx)  soit  convergente,  il  faut  que  les  coefficients 
h  augmentent  avec  une  rapidité  (suffisante. 

Si  l'on  a: 

I  ^  I  <  p  et  I  fl-/,  I  <  p, 

c'est-à-dire  : 

I  xuk  1  <  p^ 

la  série  sera  convergente  quand  : 

hi  >  p2'. 

En  somme,  cela  revient  à  dire  que  la  probabilité  pour  que 
les  derniers  coefficients  A,  s'écartent  de  zéro  devient  de 
plus  en  plus  faible.  Il  suffit  de  supposer  qu'à  partie  du  n^ 
rang  les  h  sont  infinis.  Dans  <p  (a?),  les  termes  extrêmes  où 
entrent  /?„,  A„+^...  s'annuleront  et  cp  [x]  sera  un  polynôme 
d'ordre  n. 

10.  Cherchons  à  dégager  une  impression  de  l'ensemble 
de  ce  cours.  Dans  les  données  des  problèmes,  il  est  entré 
une  part  considérable  d'arbitraire,  même  dans  les  cas  les 
plus  simples,  ceux  où  l'on  n'avait  affaire  qu'à  la  détermina- 
tion d'une  constante.  Lorsque  le  nombre  des  cas  possibles 
est  devenu  infiniment  grand,  les  difficultés  ont  augmenté. 
Puis,  quand  sont  intervenues  les  probabilités  des  causes,  un 
fait  important  s'est  dégagé  :  la  présence  de  cjj  a  entraîné 
diverses  hypothèses,  mais  toutes  arbitraires. 


VIXdT-DKL'XIHMF-:    LKÇoN  'H'A 

()n  110  peut  (l('|»i)iiillt'r  coni]»!!' Icivk^iiI  de  ces  liypollioscs 
arl)il  raircs  les  (|iH'sli()iis  de  protialiililcs  :  aussi  le  mot  de 
calcul  scmlilc-t-il  aud)iliiMix,  cl  il  iic  scrl  (pià  dissimulci- 
litj'îKii'ancc  altsnluc. 

Ainsi,    quelle    est   la    {d'ohahilité   pour    (pie   la    (piati'ième 

1 

dt'ciniale  du  lotiarillune  duu  nombre  (uilier  soit  \  ?  C  est  --' 

car  il  n'y  a  pas  plus  de  raison  ponr  une  décimale  que  pour 
une  autre;  nous  avouons  de  cette  manière  notre  ignorance 
complète,    car,    en    consultant   les  tables,   nous  trouverions 

cette  prohabilili'  qui   n'est  qu'approxiniativement   de  — -•  Là, 

le  problème  a  pris  une  l'orme  objective,  tout  à  fait  inabor- 
dable au  matluMuaticieu. 

Nous  avons  vu  que  si  des  corps  très  noml)reux  étaient 
animés  d'une  vitesse  de  rotation  uniforme,  mais  diiïérente 
de  l'un  à  l'autre,  (pielle  qui'  fût  la  distribution  initiale  des 
longitudes,  la  distribution  finale  serait  sensiblement  uni- 
forme. Sur  des  considérations  de  ce  genre,  on  peut  essayer 
de  fonder  une  espèce  de  calcul. 

Quelle  est  la  probabilité  pour  que  des  comètes,  étrangères 
au  système  solaire,  aient  une  orbite  hyperbolique  ?  On  sup- 
posera jjien  que,  à  une  certaine  distance  du  soleil,  les  co- 
mètes sont  uniformément  réparties  dans  l'espace  ;  mais  sur 
quoi  fonder  celte  hypothèse  V  en  vertu  de  quelle  cause  ? 

Quelle  que  soit  cette  cause,  sa  probabilité  tout  au  moins 

est  susceptible  d'être  représentée  par  /  f  [x.y^z)  dxdyclz, 

étendue  à  toutes  les  valeurs  qui  satisfont  aux  conditions 
imposées.  Et  alors  on  dira,  on  admettra  que  f  est  continue, 
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274  CALCUL    DES    PROBABILITES 

qu'elle  varie  très  lentement,  que  dans  une  portion  très  faible 
de  l'espace  elle  est  constante. 

C'est  seulement  par  des  hypothèses  de  ce  genre  qu'on 
arrivera  ainsi  à  poser  les  problèmes  ;  mais  on  ne  doit  pas 
s'attendre  à  rencontrer  quelque  résultat  pleinement  satisfai- 
sant. Le  calcul  des  probabilités  offre  une  contradiction  dans 
les  termes  mêmes  qui  servent  à  le  désigner,  et,  si  je  ne  crai- 
gnais de  rappeler  ici  un  mot  trop  souvent  répété,  je  dirais 
qu'il  nous  enseigne  surtout  une  chose  :  c'est  de  savoir  que 
nous  ne  savons  rien. 


FIN 
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